前言
AI 正在渗透进生活,但中文用户常面临英文界面、高昂 API 费用及网络限制等问题。文心一言 4.5 正式开源,具备'能跑、好用、懂中文'的特点,适合在本地部署使用。
一、文心 4.5 各项能力测评
图像识别
测试中,文心一言准确识别了图片中的昆虫及门上的透明胶带细节,反应迅速且答案健全。
通识问答
模型在物理、生物、化学及人文历史等基础学科问题上回答准确,并能提供深入的中文见解。
示例问题:
- 选无穷远处为电势零点,半径为 R 的导体球带电后,其电势为 U₀,则球外离球心距离为 r 处的电场强度的大小为?
- 用含 Oligo-dT 配基的纤维素柱层析提纯真核组织 mRNA 是非常有效的方法,是因为 mRNA 含有?
- 分子中含碳碳双键,且每个双键碳上各自连有的基团不同就可产生?
逻辑推理
模型在处理概率计算、数学应用题及密码推断任务时表现良好。部分复杂推理需开启深度思考功能,普通模式下亦能解决大部分算术与逻辑问题。
二、文心一言 VS Claude VS DeepSeek VS Qwen3
由于 Gemini 和 ChatGPT 在国内访问受限或收费较高,本次对比主要聚焦于国内主流模型。
场景测试:胶带为什么在门上?
现实场景中 AI 难以理解非逻辑信息(如儿童玩耍),各模型均无法准确猜测真实原因,但文心一言在中文语境下的理解更为自然。
绕口令与常识测试
针对一系列反直觉问题(如'陨石砸到陨石坑'、'近亲结婚影响智商'等)进行评分(1-5 分)。结果显示,文心一言在中文逻辑陷阱的理解上优于其他模型,DeepSeek 和 Qwen3 在部分常识推理上存在偏差。
结论: 文心一言的中文处理能力在对比模型中最强。
三、线上 API 调用与 ERNIE-4.5-0.3B-PT 部署
1. 千帆平台 API 调用
通过百度智能云千帆平台可获取 Token 进行 API 调用。目前 ERNIE 4.0 已稳定上线,ERNIE 4.5 可通过特定页面体验。
2. Linux 环境部署
更换镜像源
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo sed -i 's|http://archive.ubuntu.com/ubuntu|http://mirrors.aliyun.com/ubuntu|g' /etc/apt/sources.list
sudo sed -i 's|http://security.ubuntu.com/ubuntu|http://mirrors.aliyun.com/ubuntu|g' /etc/apt/sources.list
sudo apt update
安装虚拟环境与依赖
python3 -m venv --without-pip /fastdeploy-env
source /fastdeploy-env/bin/activate
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python get-pip.py
安装 PaddlePaddle GPU 版本
python -m pip install paddlepaddle-gpu==3.1.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/


