模型訓練 進階

Quantization

Quantization / 量化

白話解析

用較低精度(如 INT8、4-bit)儲存模型參數,減少記憶體需求和推理速度

生活化比喻

像把高解析度圖片壓縮——稍微犧牲品質,換來小很多的檔案大小