多模态大模型文本预训练知识依赖问题与 BPO 偏好对齐方案 | 极客日志