Edward Beeching's picture

Edward Beeching PRO

edbeeching

HuggingFaceH4

·

https://edbeeching.github.io/

edbeeching

AI & ML interests

None yet

Recent Activity

updated a dataset 2 days ago

edbeeching/Polaris-Dataset-53K-6-8

published a dataset 2 days ago

edbeeching/Polaris-Dataset-53K-6-8

updated a dataset 2 days ago

edbeeching/Polaris-Dataset-53K-4-8

View all activity

Organizations

edbeeching 's models 391

edbeeching/Qwen3-0.6B-GKD-simple-gold-qwen3-4b-exacttoken

Updated 8 days ago • 147

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-1p7b-teacher

Updated 15 days ago • 87

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-4b-teacher

Updated 15 days ago • 268

edbeeching/Qwen3-0.6B-GKD-simple-gold-topk

Updated 16 days ago • 258

edbeeching/Qwen3-0.6B-GKD-simple-gold2

Updated 18 days ago • 785

edbeeching/Qwen3-4B-Base-SFT-tr5

Text Generation • 4B • Updated 18 days ago • 2.93k

edbeeching/Qwen3-4B-Instruct-2507-SFT-tr5

Text Generation • 4B • Updated 18 days ago • 2.98k

edbeeching/Qwen3-4B-Thinking-2507-SFT-tr5

Text Generation • 4B • Updated 18 days ago • 2.76k

edbeeching/Qwen3-0.6B-GKD-simple-gold

Updated 18 days ago • 75

edbeeching/Qwen3-4B-GKD-simple-gold

Updated 19 days ago • 453

edbeeching/Qwen3-0.6B-GKD-simple

Updated 21 days ago • 662

edbeeching/Qwen3-4B-GKD-simple

Updated 22 days ago • 368

edbeeching/Qwen3-4B-GKD

Updated 23 days ago • 11

edbeeching/Qwen3-4B-GKD-push

Updated 23 days ago • 1

edbeeching/pipeline-trl-push-callback-smoke-20260317t210929z

Updated 23 days ago • 2

edbeeching/pipeline-trl-test

Updated 23 days ago • 15

edbeeching/Qwen3-0.6B-untied

Text Generation • 0.8B • Updated Jan 30 • 26

edbeeching/fixed-Qwen3-30B-A3B-Thinking-2507-SFT-v03.01-step-000000062

Text Generation • 31B • Updated Jan 23 • 2

edbeeching/Qwen3-30B-A3B-Thinking-2507-trans-5.0-format

Text Generation • 31B • Updated Jan 15 • 14

edbeeching/Qwen2.5-1.5B-Open-R1-Distill-dev

Updated Jul 25, 2025

edbeeching/OpenR1-Distill-7B-packing-benchmarks

8B • Updated Jun 9, 2025 • 3

edbeeching/OpenR1-Distill-7B

Text Generation • 8B • Updated Jun 7, 2025 • 21

edbeeching/SmolLM3-3B-instruct

Updated Jun 2, 2025

edbeeching/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • 2B • Updated Jun 2, 2025 • 2

edbeeching/DeepScaler-DeepSeek-R1-Distill-Qwen-1.5B-GRPO

2B • Updated May 22, 2025 • 3

edbeeching/Qwen2.5-7B-Instruct-GRPO

8B • Updated Mar 25, 2025 • 7

edbeeching/Qwen2.5-Math-7B-Instruct-SFT

Text Generation • 8B • Updated Mar 25, 2025 • 1

edbeeching/Qwen2.5-1.5B-Open-R1-Code-GRPO

Updated Mar 11, 2025

edbeeching/Qwen2.5-Coder-3B-Instruct-sft

Text Generation • 3B • Updated Feb 22, 2025 • 2

edbeeching/pythia-1b-deduped-tldr-online-dpo

Updated Feb 19, 2025