llmware
/

llama-3.1-instruct-onnx

Model card Files Files and versions

doberst commited on Oct 10, 2024

Commit

a954f98

·

verified ·

1 Parent(s): e6867b2

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -5,12 +5,12 @@ tags:
 - green
 - p8
 - llmware-chat
-- ov
 ---
-# llama-3.1-instruct-ov
-**llama-3.1-instruct-ov-ov** is an OpenVino int4 quantized version of Llama 3.1 Instruct, providing a very fast inference implementation, optimized for AI PCs using Intel GPU, CPU and NPU.
 [**llama-3.1-instruct**](https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct) is a leading open source general foundation model from Meta.

 - green
 - p8
 - llmware-chat
+- onnx
 ---
+# llama-3.1-instruct-onnx
+**llama-3.1-instruct-ov** is an ONNX int4 quantized version of Llama 3.1 Instruct, providing a very fast inference implementation, optimized for AI PCs using Intel GPU, CPU and NPU.
 [**llama-3.1-instruct**](https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct) is a leading open source general foundation model from Meta.