ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析 | 极客日志

PythonAI算法

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

评测百度开源文心 4.5 系列多模态大模型 ERNIE-4.5-VL-28B-A3B-Paddle。该模型采用 MoE 架构，总参数 28B，激活 3B，支持 13 万上下文。通过 PaddlePaddle 部署，对比 DeepSeek-R1 在通用文本、专业知识及多轮对话表现。结果显示 ERNIE 在多模态融合、长文本处理及本土化生态上更具优势，适合跨模态任务；DeepSeek-R1 在推理和网感内容创作上有特点。两者各有侧重，ERNIE 更适合需要图文理解及国内环境适配的场景。

苹果系统发布于 2026/3/26更新于 2026/7/2050 浏览

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

背景

人工智能技术迅猛发展，大模型成为推动各行业智能化升级的核心引擎。百度开源的文心 4.5 系列大模型中的 ERNIE-4.5-VL-28B-A3B-Paddle，凭借创新的技术架构与卓越的性能表现，在多模态处理、知识理解等领域展现出强大潜力。本文将通过详细的部署实操、多维度性能对比，深度剖析该模型在实际应用场景中的表现。

ERNIE-4.5-VL-28B-A3B-Paddle 模型介绍

关键字	值
模态	文本 & 视觉
训练阶段	后训练
参数量（总/激活）	28B / 3B
层数	28
头数（Q/KV）	20 / 4
文本专家（总/激活）	64 / 6
视觉专家（总/激活）	64 / 6
共享专家	2
上下文长度	131072

ERNIE-4.5-VL-28B-A3B 是一个多模态 MoE 聊天模型，总参数量为 28B，每个 Token 激活参数量为 3B。基于 MoE 的 A47B 和 A3B 系列，先进能力源于三大关键技术创新：

✅ 多模态异构 MoE 预训练，通过设计异构 MoE 结构、引入模态隔离路由等，联合训练文本和视觉模态，提升多模态任务性能

✅ 规模效率化基础设施，提出异构混合并行和层次负载均衡策略用于训练，采用多专家并行协作等方法用于推理，基于 PaddlePaddle 实现高性能推理

✅ 模态特定后训练，针对不同需求对预训练模型变体进行特定模态微调，在视觉语言模型微调阶段，聚焦核心能力优化数据构建和训练策略，并使用 RLVR 提升对齐和性能

ERNIE-4.5-VL-28B-A3B-Paddle 部署体验

平台准备：在飞桨 AI Studio 模型库中搜索 ERNIE-4.5-VL-28B-A3B-Paddle 模型。
环境配置：安装 aistudio-sdk 库以支持平台相关功能，使用命令行工具下载模型到本地目录。
框架安装：指定镜像源安装支持 CUDA 12.6 的 PaddlePaddle 3.1.0 GPU 版本，从清华镜像源补充依赖并安装适配 GPU 的 FastDeploy 推理框架。
API 调用：通过 OpenAI Python 库调用飞桨平台的自定义 API 接口，配置自定义的 API 密钥和 base_url 指向飞桨的代理服务，创建聊天完成请求，启用流式输出模式实现实时打印模型生成的文本。
功能测试：支持图片识别及多轮对话测试。

ERNIE-4.5-VL-28B-A3B-Paddle 对比 DeepSeek-R1

对比项目	ERNIE-4.5-VL-28B-A3B	DeepSeek-R1
模型类型	多模态大模型	大型语言模型，主打推理功能
参数量	28B	6710 亿，另有 1.5B 至 70B 的蒸馏版本

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

新闻原文（可简化给模型）： '本市 XX 小区近期因宠物扰民纠纷增多，居民志愿者发起'宠物友好公约'倡议，包含遛狗时间、粪便清理等条款，经业主群讨论后，超 8 成住户支持，周末已组织首场文明遛狗宣传活动。'把这段严肃新闻改写成脱口秀段子，保留核心事件（某小区居民自发组织'宠物友好公约'），用幽默吐槽、接地气梗呈现，200 字左右

模型类型	激活参数规模	总参数量	模型特点
混合专家（MoE）模型	47B	约 424B	通过专家路由技术，保持高容量的同时显著降低 FLOPs，适用于多模态任务，通过跨模态参数共享机制实现模态间知识融合
混合专家（MoE）模型	3B	约 30B	轻量级多模态模型，具备多模态理解能力，适用于对模型规模和计算资源要求相对较低的场景
稠密参数模型	0.3B	未提及	面向边缘与移动端，参数量小、推理快，适用于资源受限的设备和场景

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

背景

ERNIE-4.5-VL-28B-A3B-Paddle 模型介绍

ERNIE-4.5-VL-28B-A3B-Paddle 部署体验

ERNIE-4.5-VL-28B-A3B-Paddle 对比 DeepSeek-R1

更多推荐文章

相关免费在线工具

通用文本理解与生成

测试内容

结果分析

专业知识问答

测试内容

结果分析

多轮对话连贯性

测试内容

结果分析

百度开源文心 4.5 系列开源

总结

更多推荐文章

相关免费在线工具

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

ERNIE-4.5-VL-28B-A3B-Paddle 与 DeepSeek-R1 多维度测评分析

背景

ERNIE-4.5-VL-28B-A3B-Paddle 模型介绍

ERNIE-4.5-VL-28B-A3B-Paddle 部署体验

ERNIE-4.5-VL-28B-A3B-Paddle 对比 DeepSeek-R1

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

通用文本理解与生成

测试内容

结果分析

专业知识问答

测试内容

结果分析

多轮对话连贯性

测试内容

结果分析

百度开源文心 4.5 系列开源

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具