1 83 2

hangyu guo

Rosiness

AI & ML interests

Natural Language Processing

Recent Activity

upvoted a paper 13 minutes ago

DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning

upvoted a paper about 2 hours ago

CLI-Gym: Scalable CLI Task Generation via Agentic Environment Inversion

upvoted a paper about 2 hours ago

Towards Autonomous Mathematics Research

View all activity

Organizations

upvoted a paper 13 minutes ago

DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning

Paper • 2602.11089 • Published about 12 hours ago • 9

upvoted 3 papers about 2 hours ago

CLI-Gym: Scalable CLI Task Generation via Agentic Environment Inversion

Paper • 2602.10999 • Published about 13 hours ago • 7

Towards Autonomous Mathematics Research

Paper • 2602.10177 • Published 1 day ago • 12

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Paper • 2602.10560 • Published about 23 hours ago • 10

upvoted 2 papers 1 day ago

Code2World: A GUI World Model via Renderable Code Generation

Paper • 2602.09856 • Published 1 day ago • 174

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Paper • 2602.08234 • Published 3 days ago • 58

upvoted 3 papers 9 days ago

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published 10 days ago • 125

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 13 days ago • 150

Kimi K2.5: Visual Agentic Intelligence

Paper • 2602.02276 • Published 10 days ago • 225

upvoted a paper 10 days ago

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Paper • 2601.21558 • Published 14 days ago • 58

upvoted a paper 16 days ago

daVinci-Dev: Agent-native Mid-training for Software Engineering

Paper • 2601.18418 • Published 17 days ago • 124

upvoted a paper 20 days ago

Stable-DiffCoder: Pushing the Frontier of Code Diffusion Large Language Model

Paper • 2601.15892 • Published 21 days ago • 53

upvoted a paper 21 days ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published 24 days ago • 195

upvoted a paper 24 days ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 30 days ago • 150

upvoted a paper 28 days ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published 28 days ago • 126

upvoted 5 papers about 1 month ago

The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning

Paper • 2601.06002 • Published Jan 9 • 52

EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis

Paper • 2601.05808 • Published Jan 9 • 36

hangyu guo

AI & ML interests

Recent Activity

Organizations

Rosiness's activity

🎉 Free Image Generator Now Available!