视觉 - 语言建模综述:核心范式与评估实践 | 极客日志