Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

98,555

Full-text search

Active filters: trl

HectorHe/gpt-oss-20b-math14k

Text Generation • 0.0B • Updated 7 days ago • 7 • 1

mradermacher/gpt-oss-20b-trendyol-instruct-data-i1-GGUF

21B • Updated 6 days ago • 30.3k • 1

upholdbk/MarkdownGemma270M

Text Generation • 0.3B • Updated 7 days ago • 11 • 1

vinhnx90/gpt-oss-20b-multilingual-reasoning

Updated 6 days ago • 1

mradermacher/Qwen3-MOE-sft-math7k-GGUF

31B • Updated 3 days ago • 1.34k • 1

theprint/Genuine-7B-Instruct

Text Generation • 8B • Updated 6 days ago • 1

chansung/Gemma2-2B-CCRL-CUR-VAR-ASCE-NORMAL-1E

Text Generation • 3B • Updated 6 days ago • 51 • 1

sweatSmile/Gemma-3-270m-Buddha-QA

Question Answering • Updated 6 days ago • 35 • 1

oddadmix/arabic-summarization

Text Generation • 0.4B • Updated 6 days ago • 35 • 1

TAnGx1411/gptoss-unsloth-multi-thinking

Updated 4 days ago • 1

mradermacher/Genuine-7B-Instruct-GGUF

8B • Updated 5 days ago • 252 • 1

AmberYifan/Qwen3-4B-OpenR1Math-GRPO

Text Generation • 4B • Updated about 5 hours ago • 17 • 1

souviksankar2013/mistral-lora-delhi_gsdl_mention

Updated 3 days ago • 1

yasserrmd/kallamni-1.2b-v1

Text Generation • 1B • Updated 3 days ago • 54 • 1

NovaIALATAM/Amaru-VL-3B

Image-Text-to-Text • Updated 3 days ago • 51 • 1

Giedroid/gpt-oss-multilingual-sft

Updated 2 days ago • 1

emirhan-denizyol/llama-3.2-3b-tr-dapt-lora-adapter

Text Generation • Updated 2 days ago • 5 • 1

Rustamshry/Plantinga-SFT

Question Answering • Updated 2 days ago • 46 • 1

amir-ali-ai/amoozeshyar-beta

Updated 2 days ago • 1

ianxkaranja/DirectEd-Curriculum-Bot-LoRA

Text Generation • Updated 1 day ago • 12 • 1

sanchit97/chart-rvr-hard-3b

Image-to-Text • 4B • Updated about 10 hours ago • 11 • 1

Manishram/medgemma-brain-cancer-adapter

Text Generation • Updated about 18 hours ago • 12 • 1

muhammadabidhasan/arcosoph-phi3-mini-v4-lora

Updated about 1 hour ago • 1

Novaciano/Qwen2.5_Uncensored_V2_Sexting-GGUF

0.5B • Updated Dec 29, 2024 • 307 • 8

Chun121/Qwen3-4B-RPG-Roleplay-V2

Text Generation • 4B • Updated about 13 hours ago • 3.23k • 4

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 15 • 1

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 31

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 3

dshin/flan-t5-ppo

Reinforcement Learning • Updated Mar 11, 2023 • 3

SummerSigh/T5-Base-Rule-Of-Thumb-RM

Reinforcement Learning • Updated Mar 12, 2023 • 1