Durakaka

Durakaka

2 1

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

upvoted a paper 22 days ago

Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

liked a dataset 3 months ago

nvidia/Nemotron-Terminal-Corpus

View all activity

Organizations

None yet

upvoted a paper 15 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

Paper • 2606.16771 • Published 16 days ago • 13

upvoted a paper 22 days ago

Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

Paper • 2606.03980 • Published 29 days ago • 13

liked a dataset 3 months ago

nvidia/Nemotron-Terminal-Corpus

Viewer • Updated Feb 27 • 366k • 4.67k • 134