多模态 AI 技术解析:视觉与语言融合的新范式 | 极客日志