引言
文心大模型 ERNIE 4.5 已开源并首发于多个平台!不同于以往的开源模型,百度这次一口气开源了 10 款模型,覆盖基础、对话、多模态、思考等多个方向,甚至将核心训练框架、分布式策略完全开放。在基准测试中,文心开源即刷榜,性能大幅超越 Qwen3、DeepSeek-V3 等模型;下面从模型架构特性、技术分析、部署难度等来对文心模型全面解析一下!

一、文心大模型 ERNIE 4.5 开源简介
1.1 开源模型版本介绍
先来看看大家最关心的问题?文心大模型这次开源的 10 款模型,它们都有哪些版本、聚焦什么方向、参数规模多大。
文心大模型 ERNIE 4.5 开源本次主要分为 3 类:文本大语言模型、视觉语言模型、和小型密集模型。所有模型都支持 128K 上下文的上下文窗口,覆盖了基础、对话、多模态、思考等多个方向。
对于每个版本的文心模型官方都给出了两种版本:Base 基础版(预训练基础模型)和 PT(Fine-tuned 微调版)模型版本。
建议部署的话通常去选择 PT(Fine-tuned 微调版)模型,不仅因为 PT 模型性能最佳,而且它对人类偏好进行了定向优化,能更好地适配各类下游任务场景。
视觉语言模型方面,Qwen2-VL 有 3B、7B 和 72B,最大参数为 720 亿,而文心视觉语言模型的参数达到了 4240 亿,活跃参数达 470 亿。均大于通义千问视觉语言模型的参数规模。
1.2 基准测试表现
文心大模型开源除带来了各种各样的版本,在基准测试方面也是表现极佳,在多个文本和多模态数据集上取得了 SOTA 的性能,大幅超越 Qwen3、DeepSeek-V3 等模型。
从上图我们可以看到文心 300B 的参数模型大幅超越了 Qwen3、DeepSeek-V3,但规模只有 DeepSeek-V3 6710 亿参数的一半,可谓是相当强悍了。
其中在 ERNIE-4.5-21B-A3B 后训练模型,ERNIE-4.5-21B-A3B-Base 的参数量仅为 210 亿比 Qwen3-30B 300 亿参数更小,却在 BBH 和 CMATH 在内的多个数学和推理基准上效果优于 Qwen3-30B-A3B-Base。实现了效果和效率的双向平衡。
1.3 全面的工具生态链
除此之外文心大模型本次开源全部按照 Apache 2.0 协议开源,这意味着我们不管是使用它进行学术研究,还是用在商用领域开发产业相关的应用项目,都完全没问题。
























































