naver-hyperclovax
/

HyperCLOVAX-SEED-Text-Instruct-0.5B

Text Generation

text-generation-inference

Model card Files Files and versions Community

kbu1564 commited on Jun 4

Commit

4d88cd0

·

verified ·

1 Parent(s): b8c527c

Update README.md

Files changed (1) hide show

README.md +16 -14

README.md CHANGED Viewed

@@ -55,25 +55,27 @@ This represents approximately a 39× reduction in pretraining cost relative to `
 ### Python Code
 For better inference results with `HyperCLOVAX-SEED-Text-Instruct-0.5B`, we recommend setting `repetition_penalty` to `1.2`.
-```python
-from transformers import AutoModelForCausalLM, AutoTokenizer
-model = AutoModelForCausalLM.from_pretrained("naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-0.5B").to(device="cuda")
-tokenizer = AutoTokenizer.from_pretrained("naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-0.5B")
 chat = [
-  {"role": "tool_list", "content": ""},
-  {"role": "system", "content": "- AI 언어모델의 이름은 \"CLOVA X\" 이며 네이버에서 만들었다.\n- 오늘은 2025년 04월 24일(목)이다."},
-  {"role": "user", "content": "슈뢰딩거 방정식과 양자역학의 관계를 최대한 자세히 알려줘."},
 ]
 inputs = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_dict=True, return_tensors="pt")
-inputs = inputs.to(device="cuda")
-output_ids = model.generate(**inputs,
-                            max_length=1024,
-                            stop_strings=["<|endofturn|>", "<|stop|>"],
-                            repetition_penalty=1.2,
-                            tokenizer=tokenizer)
-print(tokenizer.batch_decode(output_ids))
 ```
 ### Result

 ### Python Code
 For better inference results with `HyperCLOVAX-SEED-Text-Instruct-0.5B`, we recommend setting `repetition_penalty` to `1.2`.
+```
+model_name = "naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-0.5B"
+model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
+tokenizer = AutoTokenizer.from_pretrained(model_name)
 chat = [
+    {"role": "tool_list", "content": ""},
+    {"role": "system", "content": "- AI 언어모델의 이름은 \"CLOVA X\" 이며 네이버에서 만들었다.\n- 오늘은 2025년 04월 24일(목)이다."},
+    {"role": "user", "content": "슈뢰딩거 방정식과 양자역학의 관계를 최대한 자세히 알려줘."},
 ]
 inputs = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_dict=True, return_tensors="pt")
+inputs = inputs.to("cuda")
+output_ids = model.generate(
+    **inputs,
+    max_length=1024,
+    stop_strings=["<|endofturn|>", "<|stop|>"],
+    repetition_penalty=1.2,
+    tokenizer=tokenizer
+    )
+print(tokenizer.batch_decode(output_ids)[0])
 ```
 ### Result