文心 4.5 系列大模型本地化部署与多模型深度测评
背景
百度发布文心大模型 4.5 系列开源模型,涵盖从数亿到数百亿参数规模。其针对 MoE 架构提出创新多模态异构结构,适用于从大语言模型向多模态模型的持续预训练,能显著增强多模态理解能力,在文本和多模态任务上刷新多项基准测试记录,该系列模型均用飞桨框架训练、推理和部署,模型 FLOPs 利用率达 47%,以 Apache 2.0 协议开源,助力学术研究与产业应用。
百度开源文心 4.5 系列开源大模型介绍
百度开源文心 4.5 系列模型类型丰富,包括基于飞桨框架的 Base-Paddle、Paddle,以及基于 PyTorch 框架的 Base-PT、PT,还有多种参数量与架构各异的文本及多模态模型,像拥有 MoE 架构、参数量达 3000 亿总参用于复杂文本理解与生成的 ERNIE-4.5-300B-A47B,424 亿总参实现图文交互的多模态模型 ERNIE-4.5-VL-424B-A47B 等,分别适用于从基于不同框架二次开发的通用场景,到复杂文本、跨模态任务,再到移动端等资源受限场景的各类需求。 模型类别划分:按类型分 MoE 模型、大语言模型(LLMs)、视觉语言模型(VLMs)、稠密型模型,覆盖不同技术路线与应用场景,大语言模型专注文本交互,视觉语言模型支持文本、图像、视频多模态输入,满足多样需求。 功能特性呈现:明确各模型输入输出模态,大语言模型和稠密型模型多为文本输入输出,视觉语言模型可处理图像、视频等多模态,且部分模型上下文窗口达 128K,体现长文本处理能力,助力理解复杂、长篇内容,为技术选型(如多模态场景选视觉语言模型)、应用开发(依输入输出需求匹配模型)提供清晰指引。
| 模型名称 | 核心特点 | 适用场景 |
|---|---|---|
| Base-Paddle | 基于飞桨框架的基座模型,通用预训练基础 | 需基于飞桨框架二次开发的通用场景 |
| Paddle | 基于飞桨框架,经后训练优化(非基座) | 飞桨生态下的特定任务(如对话、生成) |
| Base-PT | 基于 PyTorch 框架的基座模型,通用预训练基础 | 需基于 PyTorch 框架二次开发的通用场景 |
| PT | 基于 PyTorch 框架,经后训练优化(非基座) | PyTorch 生态下的特定任务(如对话、生成) |
| ERNIE-4.5-300B-A47B | 文本模型,3000 亿总参(激活 47 亿),MoE 架构 | 复杂文本理解与生成 |
| ERNIE-4.5-VL-424B-A47B | 多模态模型,424 亿总参(激活 47 亿),图文交互 | 复杂跨模态任务(图文推理、生成) |
| ERNIE-4.5-VL-28B-A3B | 多模态模型,280 亿总参(激活 30 亿),双模式交互 | 中等复杂度图文任务 |
| ERNIE-4.5-21B-A3B | 文本模型,210 亿总参(激活 30 亿),高效 MoE | 智能对话、内容创作 |
| ERNIE-4.5-0.3B | 轻量级文本模型,3 亿参,适配边缘环境 | 移动端、资源受限场景的对话 / 生成 |
本地化部署 ERNIE-4.5-300B-A47B
- 访问官方模型专区,选择大模型 baidu/ERNIE-4.5-300B-A47B,查看开发文档。
- 模型克隆至本地,使用 HTTPS 方式克隆。


