Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,192

Full-text search

Active filters: reinforcement-learning, transformers

mradermacher/InfiGUI-G1-7B-i1-GGUF

Reinforcement Learning • 8B • Updated Aug 12 • 244 • 1

mradermacher/InfiGUI-G1-3B-GGUF

Reinforcement Learning • 3B • Updated Aug 12 • 179 • 1

mradermacher/InfiGUI-G1-3B-i1-GGUF

Reinforcement Learning • 3B • Updated Aug 12 • 288 • 1

ajagota71/SmolLM-135M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.1B • Updated Aug 14 • 3

ajagota71/SmolLM-135M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.1B • Updated Aug 14 • 4

ajagota71/SmolLM-360M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.4B • Updated Aug 14 • 3

ajagota71/SmolLM-360M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.4B • Updated Aug 14 • 3

ajagota71/SmolLM-135M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.1B • Updated Aug 14 • 2

ajagota71/SmolLM-360M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.4B • Updated Aug 14 • 3

ajagota71/SmolLM-135M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.1B • Updated Aug 14 • 3

ajagota71/SmolLM-360M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.4B • Updated Aug 14 • 3

ajagota71/SmolLM-135M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.1B • Updated Aug 14 • 2

ajagota71/SmolLM-135M-detox

Reinforcement Learning • 0.1B • Updated Aug 14 • 3

ajagota71/SmolLM-360M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.4B • Updated Aug 15 • 2

ajagota71/SmolLM-360M-detox

Reinforcement Learning • 0.4B • Updated Aug 15 • 2

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.1B • Updated Aug 15 • 3

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.4B • Updated Aug 15 • 3

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.1B • Updated Aug 15 • 6

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.4B • Updated Aug 15 • 6

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.1B • Updated Aug 15 • 3

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.4B • Updated Aug 15 • 3

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.1B • Updated Aug 15 • 3

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.1B • Updated Aug 15 • 3

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.4B • Updated Aug 15 • 3

ajagota71/SmolLM2-135M-detox

Reinforcement Learning • 0.1B • Updated Aug 15 • 4

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.4B • Updated Aug 15 • 2

ajagota71/SmolLM2-360M-detox

Reinforcement Learning • 0.4B • Updated Aug 15 • 4

ajagota71/Qwen2.5-0.5B-detox-checkpoint-epoch-20

Reinforcement Learning • 0.5B • Updated Aug 15 • 3

ajagota71/gemma-3-270m-detox-checkpoint-epoch-20

Reinforcement Learning • 0.3B • Updated Aug 15 • 3

ajagota71/Qwen2.5-0.5B-detox-checkpoint-epoch-40

Reinforcement Learning • 0.5B • Updated Aug 15 • 3