文心一言与通义千问大模型能力对比评测 | 极客日志

编程语言AI算法

文心一言与通义千问大模型能力对比评测

对文心一言和通义千问两款大语言模型进行了多维度能力对比评测。测试涵盖逻辑推理、总结归纳、计算能力、历史知识、策略规划、创作能力、角色扮演、故事续写、伦理决策、记忆能力、基础数学运算等纯文本任务，以及平面设计、文生图、图像识别、图像理解等视觉处理任务。结果显示，两款模型在大多数文本任务上表现优秀，尤其在历史知识和逻辑推理方面回答准确；在图像相关任务中，文心一言和通义千问均能较好地完成描述与识别，但在部分复杂图像解析（如数学题求解）上存在响应缺失。整体而言，两者均为具备较强综合能力的 AI 模型。

Pythonist发布于 2026/4/6更新于 2026/7/2251 浏览

文心一言与通义千问大模型能力对比评测

一、纯文本任务测试（序号 1-11）

序号	考察能力	题目	回复	评价
1	逻辑推理	一个人带一只黄狗、一只白兔和一颗白菜过河...	文心一言：第一步：人带着白兔过河，然后人独自返回...；通义千问：・带兔过河（左→右）。・人回（右→左）。・带狗过河（左→右）。・带兔回（右→左）。・带菜过河（左→右）。・人回（右→左）。・带兔过河（左→右）。	优秀
2	总结归纳	我家的猫叫花咪咪，我家的狗叫黄旺旺，请问我家的羊叫什么	文心一言：题目中没有给出羊的名字相关信息，无法直接确定你家羊的名字哦...；通义千问：从你给出的猫和狗的名字来看，名字有叠字的特点...	良好
3	计算能力	753×951=？	文心一言：753×951 的计算结果是 716103。计算过程：753×(900+50+1)=...；通义千问：753×951=716103	优秀
4	历史知识	'五代十国'包括哪些朝代	文心一言：五代是指唐朝灭亡后依次更替的位于中原地区的五个政权...；通义千问：五代十国是中国历史上的分裂时期，'五代'指中原地区的五个王朝...	优秀
5	历史知识 + 逻辑推理	刘备怎样才能统一天下	文心一言：刘备若想统一天下，需从以下几方面着手：1. 稳固后方...；通义千问：刘备要统一天下，核心是解决战略失误和内部隐患...	优秀
6	创作能力	我是一个科技公司的老板，请帮我设计一份简短的公司年会发言稿...	文心一言：各位同事，新年好！过去一年，我们以创新为刃...；通义千问：各位伙伴，岁末欢聚，感恩同行！这一年，我们靠技术突围...	优秀
7	角色扮演 + 创作能力	我是一名女学生，身高 160cm，体重 60kg，平时学习比较紧张...	文心一言：30 分钟学生健身计划 1. 热身（5min）...；通义千问：每日 30min 健身计划（学生版）1. 热身（5min）...

序号	考察能力	题目	回复	评价
12	平面设计	请设计一个科技公司的 Logo，要求扁平化风格，构图简洁明了	文心一言：由几何图形'圆形 + 箭头'构成，圆形代表科技的包容与无限可能...；通义千问：扁平化科技 Logo 设计核心图形：两个重叠的正方形...	良好
13	文生图	请生成一张名为'花丛中的女孩'的图像：明媚的阳光下...	文心一言：明媚阳光洒落，金黄光线勾勒出花丛轮廓...；通义千问：生成的'花丛中的女孩'图像如下：晴朗日光下，大片粉紫色花田铺展...	优秀
14	图像识别	请识别图像中的景点	文心一言：这是北京天坛公园的核心建筑祈年殿...；通义千问：该景点是北京天坛的祈年殿，属于天坛公园的主体建筑之一...	优秀
15	图像识别	上传一张迈克尔·乔丹的图像，请大语言模型识别其中是谁	文心一言：这是篮球运动员迈克尔・乔丹，他身穿芝加哥公牛队 23 号球衣...；通义千问：图中人物是迈克尔・乔丹，他是前美国职业篮球运动员...	优秀
16	图像识别	请识别图像中有几个人，他们在干什么	文心一言：这张图中有 7 个人，他们穿着统一风格的服装...；通义千问：图里有 7 个人，他们穿着带有相同标识的衣服...	优秀
17	图像识别	请识别图像中人物的表情，分析其此刻的心情	文心一言：图中 7 个人的表情以大笑、咧嘴微笑为主...；通义千问：图像里的人物大多是大笑的表情，嘴巴张开、笑容明显...	优秀
18	图像识别	请识别图像中人物的大概年龄	文心一言：大概 30 岁；通义千问：大概 30 岁	合格
19	图像识别 + 数学能力	准备一张包含初中数学题的图像，请大语言模型求解，并给出求解的过程	文心一言：(未提供回复)；通义千问：(未提供回复)	(无评价)