偏好对齐技术:通用模型蒸馏、领域模型蒸馏与自我提升 | 极客日志