吴恩达团队研究：多模态多样本上下文学习无需微调即可适应新任务

综述由AI生成斯坦福吴恩达团队评估了先进多模态基础模型在多样本上下文学习中的表现。研究发现，利用大量演示示例可快速适应新任务而无需微调。批量查询显著降低延迟和成本。Gemini 1.5 Pro 在数据效率上优于 GPT-4o。该研究为多模态应用开辟了新路径，建议开发者优先利用长上下文窗口和批量 API 调用来构建高效系统。

暖阳发布于 2025/2/6更新于 2026/6/326 浏览

吴恩达团队新作：多模态多样本上下文学习，无需微调快速适应新任务

本研究评估了先进多模态基础模型在 10 个数据集上的多样本上下文学习（Many-shot In-Context Learning），揭示了持续的性能提升。批量查询显著降低了每个示例的延迟和推理成本而不牺牲性能。这些发现表明：利用大量演示示例可以快速适应新任务和新领域，而无需传统的微调。

背景介绍

在近期的多模态基础模型（Multimodal Foundation Model）研究中，上下文学习（In-Context Learning, ICL）已被证明是提高模型性能的有效方法之一。ICL 允许模型通过输入提示中的示例直接生成输出，而无需更新模型参数。

然而，受限于基础模型的上下文长度，尤其是对于需要大量视觉 token 来表示图片的多模态基础模型，已有的相关研究只局限于在上下文中提供少量样本（Few-shot）。这限制了模型利用更多先验知识的能力。

令人激动的是，最新的技术进步大大增加了模型的上下文窗口（Context Window），这为探索使用更多示例进行上下文学习提供了可能性。基于此，斯坦福吴恩达团队的最新研究——ManyICL，主要评估了目前最先进的多模态基础模型在从少样本（少于 100）到多样本（最高至 2000）上下文学习中的表现。

通过对多个领域和任务的数据集进行测试，团队验证了多样本上下文学习在提高模型性能方面的显著效果，并探讨了批量查询对性能和成本及延迟的影响。

图 1：Many-shot ICL 与零样本、少样本 ICL 的比较示意图

方法概览

模型选择

本研究选择了三种先进的多模态基础模型进行评估：

GPT-4o：OpenAI 推出的最新多模态模型，具有极高的通用性和响应速度。
GPT-4 (V)-Turbo：OpenAI 的视觉增强版本，专注于复杂视觉任务。
Gemini 1.5 Pro：Google 推出的大上下文窗口模型，原生支持超长序列处理。

出于 GPT-4o 优越的表现，研究团队在正文中着重讨论 GPT-4o 和 Gemini 1.5 Pro，GPT4 (V)-Turbo 的相关内容请参阅附录。

数据集与任务

数据集方面，研究团队在 10 个跨越不同领域的基准数据集上进行了广泛的实验。这些领域包括：

自然影像
医学影像
遥感影像
分子影像

任务类型涵盖：

多分类（Multi-class Classification）
多标签分类（Multi-label Classification）
细粒度分类（Fine-grained Classification）

图 2：基准数据集汇总

实验设置

为了测试增加示例数量对模型性能的影响，研究团队逐步增加了上下文中提供的示例数量，最高达到近 2000 个示例。同时，考虑到多样本学习的高成本和高延迟，研究团队还探索了批量处理查询的影响。

在这里，批量查询指的是在单次 API 调用中处理多个查询请求。这种机制利用了现代大模型 API 的并行处理能力，旨在优化资源利用率。

实验结果

多样本上下文学习性能评估

总体表现

包含近 2000 个示例的多样本上下文学习在所有数据集上均优于少样本学习。随着示例数量的增加，模型性能呈现不同的趋势：

Gemini 1.5 Pro：模型的性能呈现出持续的对数线性提升，显示出极强的长上下文理解能力。
GPT-4o：表现较不稳定，但在部分任务上仍保持较高水平。

图 3：示例数量与模型性能关系曲线

数据效率

研究测量了模型的上下文学习数据效率，即模型从示例中学习的速度。结果表明，Gemini 1.5 Pro 在绝大部分数据集上显示出比 GPT-4o 更高的上下文学习数据效率，意味着它能够更有效地从示例中提取特征并进行泛化。

吴恩达团队研究：多模态多样本上下文学习无需微调即可适应新任务

吴恩达团队新作：多模态多样本上下文学习，无需微调快速适应新任务

背景介绍

方法概览

模型选择

数据集与任务

实验设置

实验结果

多样本上下文学习性能评估

总体表现

数据效率

更多推荐文章

相关免费在线工具

批量查询的影响

总体表现

零样本场景下的性能提升

成本和延迟分析

结论与展望

技术启示

更多推荐文章

相关免费在线工具

吴恩达团队研究：多模态多样本上下文学习无需微调即可适应新任务

吴恩达团队新作：多模态多样本上下文学习，无需微调快速适应新任务

背景介绍

方法概览

模型选择

数据集与任务

实验设置

实验结果

多样本上下文学习性能评估

总体表现

数据效率

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

批量查询的影响

总体表现

零样本场景下的性能提升

成本和延迟分析

结论与展望

技术启示

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具