Maziyar Panahi's picture

Building on HF

Maziyar Panahi PRO

MaziyarPanahi

·

AI & ML interests

Post-Training, RLHF, RL, model merging, quantization, synthetic datasets, AI in Health

Recent Activity

replied to ZennyKenny's post about 21 hours ago

🫠 Brutal! Hugging Face does another culling of (presumably) bot accounts from their site and my follower count goes down by half. 💀 TFW my content and models only appeal to bots. Who’s got the current best AI girlfriend app guys?

replied to their post about 21 hours ago

🚨 Day 8/8: OpenMed Medical Reasoning Dataset Release - THE GRAND FINALE Today I complete my 8-day release series with Medical-Reasoning-SFT-Mega. The largest open medical reasoning dataset, combining 7 state-of-the-art AI models with fair distribution deduplication. THE 7 SOURCE MODELS (Original Sample Counts): 1. Trinity-Mini: 810,284 samples 2. Qwen3-Next-80B: 604,249 samples 3. GPT-OSS-120B: 506,150 samples 4. Nemotron-Nano-30B: 444,544 samples 5. GLM-4.5-Air: 225,179 samples 6. MiniMax-M2.1: 204,773 samples 7. Baichuan-M3-235B: 124,520 samples TOTAL BEFORE DEDUPLICATION: 2,919,699 samples TOKEN COUNTS: - Content tokens: 2.22 Billion - Reasoning tokens: 1.56 Billion - Total tokens: 3.78 Billion - Samples with chain-of-thought: 100% Quick Start: ``` from datasets import load_dataset ds = load_dataset("OpenMed/Medical-Reasoning-SFT-Mega") ``` All datasets Apache 2.0 licensed. Free for research and commercial use. Thank you for following OpenMed's release series. I can't wait to see what you build. 🔥 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Mega https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Trinity-Mini https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-GLM_4.5_Air https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-MiniMax-M2.1 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Qwen3-Next-80B https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Nemotron-Nano-30B https://huggingface.co/datasets/OpenMed/Medical-Reasonin https://huggingface.co/collections/OpenMed/medical-datasets

posted an update about 21 hours ago

🚨 Day 8/8: OpenMed Medical Reasoning Dataset Release - THE GRAND FINALE Today I complete my 8-day release series with Medical-Reasoning-SFT-Mega. The largest open medical reasoning dataset, combining 7 state-of-the-art AI models with fair distribution deduplication. THE 7 SOURCE MODELS (Original Sample Counts): 1. Trinity-Mini: 810,284 samples 2. Qwen3-Next-80B: 604,249 samples 3. GPT-OSS-120B: 506,150 samples 4. Nemotron-Nano-30B: 444,544 samples 5. GLM-4.5-Air: 225,179 samples 6. MiniMax-M2.1: 204,773 samples 7. Baichuan-M3-235B: 124,520 samples TOTAL BEFORE DEDUPLICATION: 2,919,699 samples TOKEN COUNTS: - Content tokens: 2.22 Billion - Reasoning tokens: 1.56 Billion - Total tokens: 3.78 Billion - Samples with chain-of-thought: 100% Quick Start: ``` from datasets import load_dataset ds = load_dataset("OpenMed/Medical-Reasoning-SFT-Mega") ``` All datasets Apache 2.0 licensed. Free for research and commercial use. Thank you for following OpenMed's release series. I can't wait to see what you build. 🔥 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Mega https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Trinity-Mini https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-GLM_4.5_Air https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-MiniMax-M2.1 https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Qwen3-Next-80B https://huggingface.co/datasets/OpenMed/Medical-Reasoning-SFT-Nemotron-Nano-30B https://huggingface.co/datasets/OpenMed/Medical-Reasonin https://huggingface.co/collections/OpenMed/medical-datasets

View all activity

Organizations

replied to ZennyKenny's post about 21 hours ago

i once announced i crossed 4k on X, celebrated it with the community. just to come back in 3 days and see it down to 3600! 😅 i mean, bots are bad and don't make the platform look good so they should be removed. but took me a long time to go back to 4k! 😊

replied to their post about 21 hours ago

Please follow OpenMed 🤗

posted an update about 21 hours ago

Post

1221

🚨 Day 8/8: OpenMed Medical Reasoning Dataset Release - THE GRAND FINALE

Today I complete my 8-day release series with Medical-Reasoning-SFT-Mega.
The largest open medical reasoning dataset, combining 7 state-of-the-art AI models with fair distribution deduplication.

THE 7 SOURCE MODELS (Original Sample Counts):

1. Trinity-Mini: 810,284 samples
2. Qwen3-Next-80B: 604,249 samples
3. GPT-OSS-120B: 506,150 samples
4. Nemotron-Nano-30B: 444,544 samples
5. GLM-4.5-Air: 225,179 samples
6. MiniMax-M2.1: 204,773 samples
7. Baichuan-M3-235B: 124,520 samples

TOTAL BEFORE DEDUPLICATION: 2,919,699 samples

TOKEN COUNTS:
- Content tokens: 2.22 Billion
- Reasoning tokens: 1.56 Billion
- Total tokens: 3.78 Billion
- Samples with chain-of-thought: 100%

Quick Start:

from datasets import load_dataset
ds = load_dataset("OpenMed/Medical-Reasoning-SFT-Mega")

All datasets Apache 2.0 licensed. Free for research and commercial use.

Thank you for following OpenMed's release series. I can't wait to see what you build. 🔥

OpenMed/Medical-Reasoning-SFT-Mega
OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2
OpenMed/Medical-Reasoning-SFT-Trinity-Mini
OpenMed/Medical-Reasoning-SFT-GLM_4.5_Air
OpenMed/Medical-Reasoning-SFT-MiniMax-M2.1
OpenMed/Medical-Reasoning-SFT-Qwen3-Next-80B
OpenMed/Medical-Reasoning-SFT-Nemotron-Nano-30B
https://huggingface.co/datasets/OpenMed/Medical-Reasonin

https://huggingface.co/collections/OpenMed/medical-datasets

5 replies

·

liked a dataset 1 day ago

OpenMed/Medical-Reasoning-SFT-Mega

Viewer • Updated 1 day ago • 1.79M • 53 • 4

published a dataset 1 day ago

OpenMed/Medical-Reasoning-SFT-Mega

Viewer • Updated 1 day ago • 1.79M • 53 • 4

updated a collection 1 day ago

Medical Datasets

16 items • Updated 1 day ago • 12

updated a dataset 1 day ago

OpenMed/Medical-Reasoning-SFT-Mega

Viewer • Updated 1 day ago • 1.79M • 53 • 4

updated a collection 1 day ago

Medical Datasets

16 items • Updated 1 day ago • 12

updated a collection 2 days ago

Medical Datasets

16 items • Updated 1 day ago • 12

liked a dataset 2 days ago

OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2

Viewer • Updated 2 days ago • 506k • 96 • 4

published a dataset 2 days ago

OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2

Viewer • Updated 2 days ago • 506k • 96 • 4

updated a dataset 2 days ago

OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B-V2

Viewer • Updated 2 days ago • 506k • 96 • 4

updated 2 collections 3 days ago

Medical Datasets

16 items • Updated 1 day ago • 12

Trinity-Large

5 items • Updated 3 days ago • 39

liked a dataset 3 days ago

OpenMed/Medical-Reasoning-SFT-Baichuan-M3-235B

Viewer • Updated 3 days ago • 125k • 146 • 4

published a dataset 3 days ago

OpenMed/Medical-Reasoning-SFT-Baichuan-M3-235B

Viewer • Updated 3 days ago • 125k • 146 • 4

New activity in OpenMed/Medical-Reasoning-SFT-Baichuan-M3-235B 3 days ago

Update README.md

#1 opened 3 days ago by

updated a dataset 3 days ago

OpenMed/Medical-Reasoning-SFT-Baichuan-M3-235B

Viewer • Updated 3 days ago • 125k • 146 • 4

updated a collection 3 days ago

Medical Datasets

16 items • Updated 1 day ago • 12

liked a dataset 4 days ago

OpenMed/Medical-Reasoning-SFT-Nemotron-Nano-30B

Viewer • Updated 4 days ago • 445k • 239 • 16