Vincent Tu

alckasoc

alckasoc

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks

upvoted a paper 3 days ago

VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation

upvoted a paper 3 days ago

MiMo-V2-Flash Technical Report

View all activity

Organizations

upvoted 4 papers 3 days ago

WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks

Paper • 2601.02439 • Published 5 days ago • 15

VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation

Paper • 2510.23497 • Published Oct 27, 2025 • 1

MiMo-V2-Flash Technical Report

Paper • 2601.02780 • Published 4 days ago • 24

On-Policy Distillation of Language Models: Learning from Self-Generated Mistakes

Paper • 2306.13649 • Published Jun 23, 2023 • 29

liked a Space 3 days ago

Unlocking On-Policy Distillation for Any Model Family

📝

Apply on-policy distillation to any model family

updated a model 3 days ago

alckasoc/spider-on-policy-tool-search-qwen-teacher-kimi-k2

Updated 3 days ago • 1

liked a dataset 3 days ago

nvidia/Nemotron-RL-knowledge-web_search-mcqa

Viewer • Updated 29 days ago • 2.93k • 438 • 6

liked a model 4 days ago

alckasoc/spider-on-policy-tool-search-qwen-teacher-kimi-k2

Updated 3 days ago • 1

published a model 4 days ago

alckasoc/spider-on-policy-tool-search-qwen-teacher-kimi-k2

Updated 3 days ago • 1

upvoted a collection 5 days ago

Gemma 3 Release

Collection

28 items • Updated Aug 11, 2025 • 585

liked a dataset 5 days ago

nebius/SWE-rebench

Viewer • Updated 18 days ago • 27.9k • 6.98k • 48

liked a model 5 days ago

deepseek-ai/DeepSeek-V3.1-Base

Text Generation • 685B • Updated Aug 26, 2025 • 13.4k • 1.01k

liked 2 models 7 days ago

Qwen/Qwen2.5-0.5B

Text Generation • 0.5B • Updated Sep 25, 2024 • 1.65M • 353

Qwen/Qwen3-0.6B

Text Generation • 0.8B • Updated Jul 26, 2025 • 7.98M • • 962

upvoted a paper 9 days ago

Understanding R1-Zero-Like Training: A Critical Perspective

Paper • 2503.20783 • Published Mar 26, 2025 • 59

liked a model 11 days ago

alckasoc/mini-gta1-3b

Updated 11 days ago • 9 • 1

updated a model 11 days ago

alckasoc/mini-gta1-3b

Updated 11 days ago • 9 • 1

liked a dataset 12 days ago

likaixin/ScreenSpot-Pro

Viewer • Updated Apr 15, 2025 • 1.59k • 2.91k • 42

published a model 12 days ago

alckasoc/mini-gta1-3b

Updated 11 days ago • 9 • 1

upvoted a collection about 2 months ago

Qwen3-VL

Collection

37 items • Updated 10 days ago • 562

Vincent Tu

AI & ML interests

Recent Activity

Organizations

alckasoc's activity

Unlocking On-Policy Distillation for Any Model Family

🎉 Free Image Generator Now Available!