Models
Datasets
Spaces
Docs
Enterprise
SoraWatermarkRemover
Log In
Sign Up

RedHatAI
/

quantization

Model card Files Files and versions

533 MB

2 contributors

History: 6 commits

danieldk's picture

danieldk HF Staff

Build

c5018b2 11 months ago

build
Build 11 months ago
compressed_tensors
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
core
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
cutlass_extensions
Add cutlass_w8a8 11 months ago
cutlass_w8a8
Add cutlass_w8a8 11 months ago
ext-torch
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
fp8
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
gptq_marlin
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
.gitattributes

1.56 kB

Build 11 months ago
LICENSE

11.4 kB

Add cutlass_w8a8 11 months ago
README.md

181 Bytes

Fixup metadata 11 months ago
build.toml

1.78 kB

Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago
dispatch_utils.h

1.49 kB

Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` 11 months ago