Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

7

Full-text search

Active filters: NPU

NexaAI/OmniNeural-4B

Updated about 15 hours ago • 109 • 101

FluidInference/qwen3-0.6b-int4-ov-npu

Updated Jul 9 • 42

FluidInference/qwen3-1.7b-int4-ov-npu

Updated Jul 9 • 9

FluidInference/qwen3-4b-int4-ov-npu

Updated Jul 9 • 13

FastFlowLM/Llama-3.2-1B-NPU2

Text Generation • Updated 12 days ago • 252

FastFlowLM/Llama-3.2-3B-NPU2

Text Generation • Updated 12 days ago • 57

FastFlowLM/Llama-3.1-8B-NPU2

Text Generation • Updated 12 days ago • 55