d-s-b
/

Router

Text Generation

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

d-s-b commited on Aug 17

Commit

20931d0

·

verified ·

1 Parent(s): a7aad0e

Update README.md

Files changed (1) hide show

README.md +18 -6

README.md CHANGED Viewed

@@ -3,10 +3,12 @@ base_model: google/gemma-3-270m-it
 library_name: transformers
 model_name: Router
 tags:
-- generated_from_trainer
 - trl
 - sft
 licence: license
 ---
 # Model Card for Router
@@ -19,10 +21,11 @@ It has been trained using [TRL](https://github.com/huggingface/trl).
 ```python
 from transformers import pipeline
-question = "If you had a time machine, but could only go to the past or the future once and never return, which would you choose and why?"
-generator = pipeline("text-generation", model="d-s-b/Router", device="cuda")
-output = generator([{"role": "user", "content": question}], max_new_tokens=128, return_full_text=False)[0]
-print(output["generated_text"])
 ```
 ## Training procedure
@@ -30,7 +33,7 @@ print(output["generated_text"])
-This model was trained with SFT.
 ### Framework versions
@@ -55,4 +58,13 @@ Cite TRL as:
 	publisher    = {GitHub},
 	howpublished = {\url{https://github.com/huggingface/trl}}
 }
 ```

 library_name: transformers
 model_name: Router
 tags:
 - trl
 - sft
+- gemma3
 licence: license
+datasets:
+- d-s-b/synthetic-reasoning-dataset
 ---
 # Model Card for Router
 ```python
 from transformers import pipeline
+pipe = pipeline("text-generation", model="d-s-b/Router")
+messages = [
+    {"role": "user", "content": "what is capital of india"}
+]
+pipe(messages)
 ```
 ## Training procedure
+This model was trained with SFT
 ### Framework versions
 	publisher    = {GitHub},
 	howpublished = {\url{https://github.com/huggingface/trl}}
 }
+@article{gemma_2025,
+    title={Gemma 3},
+    url={https://arxiv.org/abs/2503.19786},
+    publisher={Google DeepMind},
+    author={Gemma Team},
+    year={2025}
+}
 ```