Skill Explorer

Searching protocol for "4-bit"

quantizing-models-bitsandbytes

Community

8-bit/4-bit quantization for memory-efficient LLMs.

Advanced

byovachiever

awq-quantization

Community

Compress LLMs with 4-bit AWQ.

Advanced

bychoice5346

gptq

Community

Compress LLMs to 4-bit for efficiency.

Advanced

byinformatico-madrid

awq-quantization

Community

Compress LLMs for faster, leaner inference.

Advanced

bytianhao909

hqq-quantization

Community

Compress LLMs to 4-bit without calibration.

Advanced

bytianhao909

gptq

Community

4-bit quantization for large LLMs on consumer GPUs.

Advanced

byovachiever

unsloth-qlora

Community

Extreme VRAM efficiency for LLM fine-tuning.

Advanced

bycuba6112

awq-quantization

Official

Compress LLMs for faster, cheaper inference.

Advanced

byOrchestra-Research

quantizing-models-bitsandbytes

Community

Shrink LLMs, boost performance.

Advanced

bytianhao909

awq-quantization

Community

Compress LLMs for faster inference.

Advanced

bygagan114662

hqq-quantization

Community

Quantize LLMs fast, no calibration needed.

Advanced

byDoanNgocCuong

gptq

Community

Compress LLMs to 4-bit for efficiency.

Advanced

byihatesea69