视觉语言模型(VLM)综述:训练、评估与扩展指南 | 极客日志