国产AI大模型名单详解
一、国内备案AI大模型概览
随着人工智能技术的快速发展,国内已有众多企业完成了AI大模型的备案。以下整理了目前主流的国产AI大模型清单及头部厂商的产品介绍,涵盖文本生成、多模态处理、代码编程等多种应用场景。
二、头部大模型详细介绍
1. 百度 - 文心一言
作为科技领域的领军者,百度于2023年3月16日率先推出了其生成式AI产品'文心一言',正式开启邀测。随后推出了文心一言4.0版本,并上线了专业版。基础版保持免费使用策略。文心大模型4.0实现了基础模型的全面升级,综合能力在多项评测中与GPT-4相当。
2. 智谱AI - 智谱清言
智谱AI自2019年成立以来,深耕大模型研发领域,拥有清华大学知识工程实验室(KEG)的技术支撑。发布了GLM-130B、ChatGLM、CodeGeeX、CogView等产品。面向C端用户推出聊天对话应用'智谱清言',在B端市场与多家互联网巨头及政企达成深度合作。
3. 抖音 - 云雀
抖音集团(前字节跳动)于2023年8月17日宣布推出基于云雀模型开发的AI工具'豆包'。集成了聊天机器人、写作助手以及英语学习助手等功能,支持网页、iOS及安卓平台。
4. 百川智能 - 百川
由搜狗创始人王小川创立,自2023年以来发展迅速。发布了Baichuan-7B/13B、Baichuan2-7B/13B等开源可免费商用大模型,以及Baichuan-53B、Baichuan2-53B闭源大模型。Baichuan2-13B在MMLU、CMMLU等权威评估基准中表现领先。
5. 中科院自动化研究所 - 紫东太初
成立于1956年的中科院自动化研究所推出的'紫东太初'跨模态通用人工智能平台,参数达千亿级别,支持视觉、文本、语音等多种模态。2.0版本新增了视频、传感信号、3D点云等模态数据,已在文本创作、医疗、物流、政务等行业落地。
6. Minimax - ABAB
Minimax推出了包含文本到视觉、文本到语音、文本到文本三个模态的基础模型架构,成功推出自研通用大模型'ABAB'。
7. 商汤科技 - 日日新
2023年4月推出名为'日日新SenseNova'的大模型,集成自然语言处理、内容生成、自动化数据标注等功能。旗下产品包括商量SenseChat、秒画SenseMirage、如影SenseAvatar等。最新版商量SenseChat 2.0参数规模高达千亿级。
8. 上海人工智能实验室 - 书生
'书生'项目历经数次蜕变,从首个横跨多种视觉任务的通用大模型,发展为融合视觉、语言和三维等多维元素的大模型体系。打造了书生·天际、书生·多模态、书生·浦语等产品,呈现完整的开源生态链。
9. 科大讯飞 - 星火认知大模型
新一代的认知智能典范,展现跨领域的知识和语言理解能力。集语言理解、知识问答、逻辑推理、数学解答、代码理解与编写等多重能力于一身。
10. 三六零 - 360智脑大模型
最新版本'360智脑4.0'已全面融入集团各类产品。提供卓越的文本生成和创作服务,支持文本或图片输入生成高质量图像,具备无损放大、智能消除、智能抠图等编辑功能。
11. 阿里巴巴 - 通义千问大模型
阿里云研发的底层通用大模型,迭代至2.0版本,参数规模达到千亿级别。在云栖大会上正式发布,并在各大手机应用市场同步推出APP,拓宽应用边界。
12. 腾讯 - 腾讯混元助手大模型
展现了强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。
13. 华为 - 华为云盘古NLP大模型
业界首个超千亿参数的中文预训练模型。汇聚海量图像、视频数据,孕育出视觉基础模型、多模态大模型及预测大模型,实现图像生成、理解、视频生成等多重功能。
14. 华为 - 智慧助手(小艺)大模型
根植于华为盘古L0基座大模型,针对终端消费者场景进行了深度优化。能够根据用户需求自动生成文案等内容,提供更智能的交互体验。
15. 出门问问 - 序列猴子
专注于服务B端企业,支持智能多轮对话,帮助提高对话管理和调度能力。具有长序列、多模态、单模型、大数据等特点,在问答系统、机器翻译、文本摘要等领域展现潜力。


