RedHatAI
/

quantization

Model card Files Files and versions

quantization / build /torch26-cxx11-rocm62-x86_64-linux /quantization /__init__.py

danieldk's picture

danieldk HF Staff

Build

32721c3 6 months ago

814 Bytes

	from .compressed_tensors import scaled_fp8_quant, scaled_int8_quant
	from .cutlass import (
	cutlass_scaled_mm_supports_fp8,
	cutlass_scaled_mm,
	cutlass_scaled_mm_azp,
	)
	from .marlin import (
	awq_marlin_repack,
	fp8_marlin_gemm,
	gptq_marlin_gemm,
	gptq_marlin_repack,
	gptq_marlin_24_gemm,
	marlin_qqq_gemm,
	marlin_gemm,
	)
	from .scalar_type import (
	ScalarType,
	scalar_types,
	)
	from ._ops import ops


	__all__ = [
	"ScalarType",
	"awq_marlin_repack",
	"cutlass_scaled_mm",
	"cutlass_scaled_mm_azp",
	"cutlass_scaled_mm_supports_fp8",
	"fp8_marlin_gemm",
	"gptq_marlin_24_gemm",
	"gptq_marlin_gemm",
	"gptq_marlin_repack",
	"marlin_gemm",
	"marlin_qqq_gemm",
	"ops",
	"scalar_types",
	"scaled_fp8_quant",
	"scaled_int8_quant",
	]