跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

文心一言与通义千问大模型能力对比评测

综述由AI生成对文心一言和通义千问两款大语言模型进行了多维度能力对比评测。测试涵盖逻辑推理、总结归纳、计算能力、历史知识、策略规划、创作能力、角色扮演、故事续写、伦理决策、记忆能力、基础数学运算等纯文本任务,以及平面设计、文生图、图像识别、图像理解等视觉处理任务。结果显示,两款模型在大多数文本任务上表现优秀,尤其在历史知识和逻辑推理方面回答准确;在图像相关任务中,文心一言和通义千问均能较好地完成描述与识别,但在部分复杂图像解析(如数学题求解)上存在响应缺失。整体而言,两者均为具备较强综合能力的 AI 模型。

Pythonist发布于 2026/4/6更新于 2026/5/2326 浏览

文心一言与通义千问大模型能力对比评测

一、纯文本任务测试(序号 1-11)

序号考察能力题目回复评价
1逻辑推理一个人带一只黄狗、一只白兔和一颗白菜过河...文心一言:第一步:人带着白兔过河,然后人独自返回...;通义千问:・带兔过河(左→右)。・人回(右→左)。・带狗过河(左→右)。・带兔回(右→左)。・带菜过河(左→右)。・人回(右→左)。・带兔过河(左→右)。优秀
2总结归纳我家的猫叫花咪咪,我家的狗叫黄旺旺,请问我家的羊叫什么文心一言:题目中没有给出羊的名字相关信息,无法直接确定你家羊的名字哦...;通义千问:从你给出的猫和狗的名字来看,名字有叠字的特点...良好
3计算能力753×951=?文心一言:753×951 的计算结果是 716103。计算过程:753×(900+50+1)=...;通义千问:753×951=716103优秀
4历史知识'五代十国'包括哪些朝代文心一言:五代是指唐朝灭亡后依次更替的位于中原地区的五个政权...;通义千问:五代十国是中国历史上的分裂时期,'五代'指中原地区的五个王朝...优秀
5历史知识 + 逻辑推理刘备怎样才能统一天下文心一言:刘备若想统一天下,需从以下几方面着手:1. 稳固后方...;通义千问:刘备要统一天下,核心是解决战略失误和内部隐患...优秀
6创作能力我是一个科技公司的老板,请帮我设计一份简短的公司年会发言稿...文心一言:各位同事,新年好!过去一年,我们以创新为刃...;通义千问:各位伙伴,岁末欢聚,感恩同行!这一年,我们靠技术突围...优秀
7角色扮演 + 创作能力我是一名女学生,身高 160cm,体重 60kg,平时学习比较紧张...文心一言:30 分钟学生健身计划 1. 热身(5min)...;通义千问:每日 30min 健身计划(学生版)1. 热身(5min)...良好
8续写如果由你来续写《红楼梦》的后 40 回,你会如何设计其中的情节?文心一言:贾府获罪后,宝玉流落江南,偶遇出家的惜春...;通义千问:贾府败落,宝玉被救后隐居山村,偶得黛玉生前诗稿...优秀
9伦理问题一列火车正常行驶,前方轨道上有 5 个小孩在玩耍...文心一言:这是经典的电车难题,没有绝对正确的答案...;通义千问:个问题没有标准答案,核心是伦理抉择。我不会变更轨道...优秀
10记忆能力最近 24h 内,我提了几个问题?其中有几个关于历史的问题文心一言:我没有实时统计 24 小时内提问数量的功能...;通义千问:于我的对话记忆是基于单轮或当前会话的...合格
11简单比大小数字 9.11 和 9.9 哪个大文心一言:比较 9.11 和 9.9 的大小,先看整数部分...;通义千问:9.9 更大。比较小数大小时,先比整数部分...优秀

二、图像处理任务测试(序号 12-19)

序号考察能力题目回复评价
12平面设计请设计一个科技公司的 Logo,要求扁平化风格,构图简洁明了文心一言:由几何图形'圆形 + 箭头'构成,圆形代表科技的包容与无限可能...;通义千问:扁平化科技 Logo 设计 核心图形:两个重叠的正方形...良好
13文生图请生成一张名为'花丛中的女孩'的图像:明媚的阳光下...文心一言:明媚阳光洒落,金黄光线勾勒出花丛轮廓...;通义千问:生成的'花丛中的女孩'图像如下:晴朗日光下,大片粉紫色花田铺展...优秀
14图像识别请识别图像中的景点文心一言:这是北京天坛公园的核心建筑祈年殿...;通义千问:该景点是北京天坛的祈年殿,属于天坛公园的主体建筑之一...优秀
15图像识别上传一张迈克尔·乔丹的图像,请大语言模型识别其中是谁文心一言:这是篮球运动员迈克尔・乔丹,他身穿芝加哥公牛队 23 号球衣...;通义千问:图中人物是迈克尔・乔丹,他是前美国职业篮球运动员...优秀
16图像识别请识别图像中有几个人,他们在干什么文心一言:这张图中有 7 个人,他们穿着统一风格的服装...;通义千问:图里有 7 个人,他们穿着带有相同标识的衣服...优秀
17图像识别请识别图像中人物的表情,分析其此刻的心情文心一言:图中 7 个人的表情以大笑、咧嘴微笑为主...;通义千问:图像里的人物大多是大笑的表情,嘴巴张开、笑容明显...优秀
18图像识别请识别图像中人物的大概年龄文心一言:大概 30 岁;通义千问:大概 30 岁合格
19图像识别 + 数学能力准备一张包含初中数学题的图像,请大语言模型求解,并给出求解的过程文心一言:(未提供回复);通义千问:(未提供回复)(无评价)

目录

  1. 文心一言与通义千问大模型能力对比评测
  2. 一、纯文本任务测试(序号 1-11)
  3. 二、图像处理任务测试(序号 12-19)
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 【GitHub项目推荐--AI Novel Generator:智能小说创作助手】
  • 前端国际化最佳实践指南
  • 使用 Web Scraper 插件抓取知乎评论数据实战指南
  • 基于STC89C52的智能家居温湿度控制系统设计
  • KWDB 运维实战:用 SQL 打通 Metrics 与 CMDB 数据融合
  • WordPress 性能极致优化指南:从服务器底层到前端缓存
  • Python 日志远程传输全解析与监控体系构建
  • 基于飞算 JavaAI 的智能在线考试系统设计与实现
  • AGI 通识与应用开发入门指南
  • 本地 AI 电话机器人:通过 UDP 传输手机通话声音的 Python 脚本
  • GitHub 浏览器插件实现界面中文翻译
  • GitHub 学生开发者认证操作指南
  • 圣光艺苑:基于 Stable Diffusion 的鎏金画框艺术生成工具
  • C++ string 类模拟实现
  • 基于 DeepFace 和 OpenCV 的实时情绪分析器实现
  • 医疗 AI 可信革命全栈实现:向量索引与贝叶斯网络
  • Llama Factory 微调实战:优化截断长度解决显存溢出
  • 前端拖拽交互实现:从原生 API 到专业库
  • C++ 类与对象基础(上)
  • OpenClaw 多飞书机器人与多 Agent 团队实战复盘

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online