图像自动文本化框架:提升多模态大模型描述质量与准确性 | 极客日志