ChickenMcSwag
/

gpt-oss-20b-lora-finetuned_fp4_step_40

Model card Files Files and versions Community

ChickenMcSwag commited on 14 days ago

Commit

03d2169

·

verified ·

1 Parent(s): 4c3eeb6

Add model card

Files changed (1) hide show

README.md +71 -0

README.md ADDED Viewed

	@@ -0,0 +1,71 @@

+---
+license: other
+base_model: openai/gpt-oss-20b
+tags:
+- gpt-oss-20b
+- lora
+- merged
+- causal-lm
+language:
+- en
+---
+# gpt-oss-20b-lora-finetuned_fp4_step_40
+This is a merged model combining GPT-OSS-20B with a fine-tuned LoRA adapter.
+## Model Details
+- **Base Model**: openai/gpt-oss-20b
+- **LoRA Checkpoint**: checkpoint-40
+- **Model Type**: Causal Language Model
+- **Model Size**: ~20B parameters
+- **Tensor Type**: bfloat16
+## LoRA Configuration
+- **Rank (r)**: 8
+- **Alpha**: 16
+- **Target Modules**: k_proj, v_proj, o_proj, q_proj
+- **Special MLP Expert Layers**: Layers 7, 15, 23
+## Quick Start
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# Load model and tokenizer
+model = AutoModelForCausalLM.from_pretrained(
+    "ChickenMcSwag/gpt-oss-20b-lora-finetuned_fp4_step_40",
+    torch_dtype="auto",
+    device_map="auto",
+    trust_remote_code=True
+)
+tokenizer = AutoTokenizer.from_pretrained("ChickenMcSwag/gpt-oss-20b-lora-finetuned_fp4_step_40")
+# Generate text
+prompt = "The future of AI is"
+inputs = tokenizer(prompt, return_tensors="pt")
+outputs = model.generate(
+    **inputs,
+    max_length=100,
+    temperature=0.7,
+    do_sample=True,
+    top_p=0.95
+)
+response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+print(response)
+```
+## Hardware Requirements
+- **Minimum VRAM**: ~40GB for inference
+- **Recommended**: 2x A100 80GB or equivalent
+## License
+This model follows the original GPT-OSS-20B license. Please refer to the base model's license and usage policy.
+## Citation
+If you use this model, please cite the original GPT-OSS-20B model.