mychen76
/

mistral7b_ocr_to_json_v1

Text Generation

text-generation-inference

Model card Files Files and versions

mychen76 commited on Oct 7, 2023

Commit

acabcec

·

1 Parent(s): 7ffe766

Update README.md

Files changed (1) hide show

README.md +22 -0

README.md CHANGED Viewed

@@ -59,3 +59,25 @@ Don't make up value not in the Input. Output must be a well-formed JSON object.`
   }
 }
 ```

   }
 }
 ```
+# Load model directly
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("mychen76/mistral7b_ocr_to_json_v1")
+model = AutoModelForCausalLM.from_pretrained("mychen76/mistral7b_ocr_to_json_v1")
+prompt=f"""### Instruction:
+You are POS receipt data expert, parse, detect, recognize and convert following receipt OCR image result into structure receipt data object.
+Don't make up value not in the Input. Output must be a well-formed JSON object.```json
+### Input:
+{receipt_boxes}
+### Output:
+"""
+with torch.inference_mode():
+    inputs = tokenizer(prompt,return_tensors="pt",truncation=True).to(device)
+    outputs = model.generate(**inputs, max_new_tokens=512)
+    result_text = tokenizer.batch_decode(outputs)[0]
+    print(result_text)