Skill Explorer

Searching protocol for "4-bit quantization"

quantizing-models-bitsandbytes

Community

8-bit/4-bit quantization for memory-efficient LLMs.

Advanced

byovachiever

awq-quantization

Community

Compress LLMs with 4-bit AWQ.

Advanced

bychoice5346

hqq-quantization

Community

Compress LLMs to 4-bit without calibration.

Advanced

bytianhao909

hqq-quantization

Community

Quantize LLMs fast, no calibration needed.

Advanced

byDoanNgocCuong

gptq

Community

4-bit quantization for large LLMs on consumer GPUs.

Advanced

byovachiever

awq-quantization

Community

Compress LLMs for faster, leaner inference.

Advanced

bytianhao909

awq-quantization

Official

Compress LLMs for faster, cheaper inference.

Advanced

byOrchestra-Research

quantizing-models-bitsandbytes

Community

Shrink LLMs, boost performance.

Advanced

bytianhao909

gptq

Community

Compress LLMs to 4-bit for efficiency.

Advanced

byinformatico-madrid

awq-quantization

Community

Compress LLMs for faster inference.

Advanced

bygagan114662

qlora

Community

Memory-efficient fine-tuning for large models

Advanced

byitsmostafa

unsloth-qlora

Community

Extreme VRAM efficiency for LLM fine-tuning.

Advanced

bycuba6112