文心大模型 4.5 开源实测：快速部署与多模态能力解析 | 极客日志

PythonAI算法

文心大模型 4.5 开源实测：快速部署与多模态能力解析

文心大模型 4.5 开源版本支持多模态理解，本次实测涵盖从环境搭建到推理部署的全流程。在 Ubuntu 22.04 配合 A100 显卡环境下，通过 PaddlePaddle 和 FastDeploy 可实现一键部署。测试显示其在人物识别、验证码 OCR 及自媒体文案分析等场景中表现优异，响应速度优于部分竞品。结合 Gradio 可快速构建前端交互界面，适合产业级知识增强应用落地。

Kubernet发布于 2026/3/29更新于 2026/7/2229 浏览

1. 前言

近期百度正式开源了文心大模型 4.5 多模态系列。该系列包含 10 款模型，涵盖 8 个混合专家模型（激活参数规模 47B/3B）及 2 个稠密参数模型（0.3B）。其中 4 款 VL 模型支持多模态特性，可理解图片、音频、视频等非文本内容。作为产业级知识增强大模型，其在多项基准测试中表现突出。本次将深入测评其部署流程及实际推理效果。

文心大模型 4.5 启动界面

2. 测评环境

2.1 硬件配置

CPU: 16 核 X86 架构 Intel 处理器
内存：64G
GPU: Nvidia A100 80G 显存

2.2 软件环境

操作系统：Ubuntu 22.04
Python: 3.10
PyTorch: 2.7

2.3 模型选择

核心能力为多模态，选用 ERNIE-4.5-VL-28B-A3B-Paddle。横向对比模型为通义千问的 Qwen2.5-VL-32B-Instruct。

3. 模型部署

得益于 AI 框架的成熟，部署已无显著卡点。百度飞桨框架支持基于 Transformer 的快速部署。相比千问模型文件（68GB），文心大模型仅 55GB，在显存消耗上略有优势。

3.1 环境准备

需一台 80G 显存的 A100 主机，可通过主流算力租赁平台获取。

3.2 安装 PaddlePaddle GPU 版

python -m pip install paddlepaddle-gpu==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

3.3 安装 FastDeploy

针对 A100 显卡专用版本：

python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

注意：若使用 4090 显卡，请参考官方文档调整安装命令。

3.4 一键部署与推理

执行以下命令完成下载并启动服务：

python -m fastdeploy.entrypoints.openai.api_server \
  --model baidu/ERNIE-4.5-VL-28B-A3B-Paddle \
  --port 8180 \
  --metrics-port 8181 \
  --engine-worker-queue-port 8182 \
  --max-model-len 32768 \
  --enable-mm \
  --reasoning-parser ernie-45-vl \
  --max-num-seqs 32

成功启动后，端口 8180 将处于监听状态，表示模型已就绪。

4. 多模态图像识别测评

4.1 明星人物识别

以奥黛丽·赫本在厨房操作烤箱的照片为例，对比两个模型的识别结果。

Qwen2.5-VL-32B 结果 识别出女性在厨房操作烤箱，描述了场景构造和物体摆放，但未识别出具体人物身份。

ERNIE-4.5-VL-28B-A3B 结果 精准识别出人物为奥黛丽·赫本，并对环境和元素进行了详细分析。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import gradio as gr
import requests
import json
import os
from PIL import Image
import io
import time
import uuid

def process_multimodal_input(image, text_input, history):
    """处理多模态输入并调用 API"""
    if image is None and not text_input.strip():
        return history, "请上传图片或输入文本"
    # 准备 API 请求
    url = "http://127.0.0.1:8180/v1/chat/completions"
    headers = {"Content-Type": "application/json"}
    content = []
    # 如果有图片，添加图片内容
    if image is not None:
        temp_dir = "temp_images"
        os.makedirs(temp_dir, exist_ok=True)
        temp_path = os.path.abspath(f"{temp_dir}/temp_image_{uuid.uuid4()}.jpg")
        image.save(temp_path)
        image_url = f"file://{temp_path}"
        content.append({"type": "image_url", "image_url": {"url": image_url}})
    # 添加文本到内容
    if text_input.strip():
        content.append({"type": "text", "text": text_input})
    else:
        if image is not None:
            content.append({"type": "text", "text": "描述一下这张图片"})
    # 更新历史记录中的用户消息
    user_message = {"role": "user", "content": content}
    messages = []
    # 添加历史消息（仅文本部分）
    for msg in history:
        if msg[0]:
            messages.append({"role": "user", "content": [{"type": "text", "text": msg[0]}]})
        if msg[1]:
            messages.append({"role": "assistant", "content": msg[1]})
    messages.append(user_message)
    payload = {"messages": messages}
    history.append((text_input if text_input.strip() else "图片查询", None))
    yield history, ""
    try:
        response = requests.post(url, headers=headers, data=json.dumps(payload))
        response_data = response.json()
        if "choices" in response_data and len(response_data["choices"]) > 0:
            result = response_data["choices"][0]["message"]["content"]
            history[-1] = (history[-1][0], result)
            yield history, ""
        else:
            error_msg = "无法获取响应，API 返回格式异常。"
            history[-1] = (history[-1][0], error_msg)
            yield history, ""
    except Exception as e:
        error_msg = f"发生错误：{str(e)}"
        history[-1] = (history[-1][0], error_msg)
        yield history, ""

def clear_chat():
    """清除聊天历史"""
    return [], ""

with gr.Blocks(title="文心大模型 4.5") as demo:
    with gr.Column():
        with gr.Row():
            gr.Markdown("# 文心大模型 4.5 - 多模态大模型智能助手")
        chatbot = gr.Chatbot(height=500)
        image_input = gr.Image(type="pil", label="", visible=False)
        text_input = gr.Textbox(placeholder="输入消息或上传图片...", label="", lines=4, max_lines=10)
        with gr.Row():
            upload_btn = gr.UploadButton("🖼️", file_types=["image"])
            send_btn = gr.Button("发送")
        with gr.Row():
            gr.Markdown("© 2025 文心大模型 4.5 | 基于 Gradio 构建")
        def handle_image_upload(image):
            return image
        upload_btn.upload(fn=handle_image_upload, inputs=[upload_btn], outputs=[image_input])
        send_btn.click(fn=process_multimodal_input, inputs=[image_input, text_input, chatbot], outputs=[chatbot, text_input]).then(
            fn=lambda: None, inputs=[], outputs=[image_input]
        )
        text_input.submit(fn=process_multimodal_input, inputs=[image_input, text_input, chatbot], outputs=[chatbot, text_input]).then(
            fn=lambda: None, inputs=[], outputs=[image_input]
        )

if __name__ == "__main__":
    demo.queue()
    demo.launch(server_name="0.0.0.0")

文心大模型 4.5 开源实测：快速部署与多模态能力解析

1. 前言

2. 测评环境

2.1 硬件配置

2.2 软件环境

2.3 模型选择

3. 模型部署

3.1 环境准备

3.2 安装 PaddlePaddle GPU 版

3.3 安装 FastDeploy

3.4 一键部署与推理

4. 多模态图像识别测评

4.1 明星人物识别

更多推荐文章

相关免费在线工具

4.2 Gradio 前端交互

4.3 验证码识别

5. 自媒体创作场景测评

5.1 爆文分析

5.2 创意生成

5.3 内容创作

6. 总结

更多推荐文章

相关免费在线工具

文心大模型 4.5 开源实测：快速部署与多模态能力解析

1. 前言

2. 测评环境

2.1 硬件配置

2.2 软件环境

2.3 模型选择

3. 模型部署

3.1 环境准备

3.2 安装 PaddlePaddle GPU 版

3.3 安装 FastDeploy

3.4 一键部署与推理

4. 多模态图像识别测评

4.1 明星人物识别

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4.2 Gradio 前端交互

4.3 验证码识别

5. 自媒体创作场景测评

5.1 爆文分析

5.2 创意生成

5.3 内容创作

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具