大语言模型四种主流微调技术解析 | 极客日志

大语言模型四种主流微调技术解析 | 极客日志

特性	SFT (全量)	LoRA	P-tuning v2	Freeze
可训练参数量	100%	约 1% - 5%	约 0.1%	约 10% - 20%
显存占用	极高	低	极低	中等
训练速度	慢	快	极快	较快
推理延迟	无额外延迟	无额外延迟	无额外延迟	无额外延迟
适用场景	数据充足，追求极致性能	资源受限，多任务切换	序列标注，NLU 任务	快速适配，保留通用性
实现难度	高	中	中	低