文心一言与通义千问大模型能力对比评测
一、纯文本任务测试(序号 1-11)
| 序号 | 考察能力 | 题目 | 回复 | 评价 |
|---|---|---|---|---|
| 1 | 逻辑推理 | 一个人带一只黄狗、一只白兔和一颗白菜过河... | 文心一言:第一步:人带着白兔过河,然后人独自返回...;通义千问:・带兔过河(左→右)。・人回(右→左)。・带狗过河(左→右)。・带兔回(右→左)。・带菜过河(左→右)。・人回(右→左)。・带兔过河(左→右)。 | 优秀 |
| 2 | 总结归纳 | 我家的猫叫花咪咪,我家的狗叫黄旺旺,请问我家的羊叫什么 | 文心一言:题目中没有给出羊的名字相关信息,无法直接确定你家羊的名字哦...;通义千问:从你给出的猫和狗的名字来看,名字有叠字的特点... | 良好 |
| 3 | 计算能力 | 753×951=? | 文心一言:753×951 的计算结果是 716103。计算过程:753×(900+50+1)=...;通义千问:753×951=716103 | 优秀 |
| 4 | 历史知识 | '五代十国'包括哪些朝代 | 文心一言:五代是指唐朝灭亡后依次更替的位于中原地区的五个政权...;通义千问:五代十国是中国历史上的分裂时期,'五代'指中原地区的五个王朝... | 优秀 |
| 5 | 历史知识 + 逻辑推理 | 刘备怎样才能统一天下 | 文心一言:刘备若想统一天下,需从以下几方面着手:1. 稳固后方...;通义千问:刘备要统一天下,核心是解决战略失误和内部隐患... | 优秀 |
| 6 | 创作能力 | 我是一个科技公司的老板,请帮我设计一份简短的公司年会发言稿... | 文心一言:各位同事,新年好!过去一年,我们以创新为刃...;通义千问:各位伙伴,岁末欢聚,感恩同行!这一年,我们靠技术突围... | 优秀 |
| 7 | 角色扮演 + 创作能力 | 我是一名女学生,身高 160cm,体重 60kg,平时学习比较紧张... | 文心一言:30 分钟学生健身计划 1. 热身(5min)...;通义千问:每日 30min 健身计划(学生版)1. 热身(5min)... | 良好 |
| 8 | 续写 | 如果由你来续写《红楼梦》的后 40 回,你会如何设计其中的情节? | 文心一言:贾府获罪后,宝玉流落江南,偶遇出家的惜春...;通义千问:贾府败落,宝玉被救后隐居山村,偶得黛玉生前诗稿... | 优秀 |
| 9 | 伦理问题 | 一列火车正常行驶,前方轨道上有 5 个小孩在玩耍... | 文心一言:这是经典的电车难题,没有绝对正确的答案...;通义千问:个问题没有标准答案,核心是伦理抉择。我不会变更轨道... | 优秀 |
| 10 | 记忆能力 | 最近 24h 内,我提了几个问题?其中有几个关于历史的问题 | 文心一言:我没有实时统计 24 小时内提问数量的功能...;通义千问:于我的对话记忆是基于单轮或当前会话的... | 合格 |
| 11 | 简单比大小 | 数字 9.11 和 9.9 哪个大 | 文心一言:比较 9.11 和 9.9 的大小,先看整数部分...;通义千问:9.9 更大。比较小数大小时,先比整数部分... | 优秀 |
二、图像处理任务测试(序号 12-19)
| 序号 | 考察能力 | 题目 | 回复 | 评价 |
|---|---|---|---|---|
| 12 | 平面设计 | 请设计一个科技公司的 Logo,要求扁平化风格,构图简洁明了 | 文心一言:由几何图形'圆形 + 箭头'构成,圆形代表科技的包容与无限可能...;通义千问:扁平化科技 Logo 设计 核心图形:两个重叠的正方形... | 良好 |
| 13 | 文生图 | 请生成一张名为'花丛中的女孩'的图像:明媚的阳光下... | 文心一言:明媚阳光洒落,金黄光线勾勒出花丛轮廓...;通义千问:生成的'花丛中的女孩'图像如下:晴朗日光下,大片粉紫色花田铺展... | 优秀 |
| 14 | 图像识别 | 请识别图像中的景点 | 文心一言:这是北京天坛公园的核心建筑祈年殿...;通义千问:该景点是北京天坛的祈年殿,属于天坛公园的主体建筑之一... | 优秀 |
| 15 | 图像识别 | 上传一张迈克尔·乔丹的图像,请大语言模型识别其中是谁 | 文心一言:这是篮球运动员迈克尔・乔丹,他身穿芝加哥公牛队 23 号球衣...;通义千问:图中人物是迈克尔・乔丹,他是前美国职业篮球运动员... | 优秀 |
| 16 | 图像识别 | 请识别图像中有几个人,他们在干什么 | 文心一言:这张图中有 7 个人,他们穿着统一风格的服装...;通义千问:图里有 7 个人,他们穿着带有相同标识的衣服... | 优秀 |
| 17 | 图像识别 | 请识别图像中人物的表情,分析其此刻的心情 | 文心一言:图中 7 个人的表情以大笑、咧嘴微笑为主...;通义千问:图像里的人物大多是大笑的表情,嘴巴张开、笑容明显... | 优秀 |
| 18 | 图像识别 | 请识别图像中人物的大概年龄 | 文心一言:大概 30 岁;通义千问:大概 30 岁 | 合格 |
| 19 | 图像识别 + 数学能力 | 准备一张包含初中数学题的图像,请大语言模型求解,并给出求解的过程 | 文心一言:(未提供回复);通义千问:(未提供回复) | (无评价) |

