跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

2023 中国大模型落地应用案例集核心洞察

综述由AI生成基于中国信通院发布的《2023 大模型落地应用案例集》,系统梳理了中国大模型产业的发展现状。文章首先回顾了中国学者在 ResNet、Transformer 等底层技术上的原创贡献,列举了华为、百度、阿里、京东等企业的早期布局与参数竞赛。其次,分析了通用大模型与垂直大模型的市场分化,详细介绍了书生浦语、通义千问、MiniMax 等代表性模型及其在 ToB 和 ToC 场景的应用。最后,探讨了大模型生态构建的重要性,指出数据治理、合规性及多模态融合是未来发展的关键方向,强调构建规范可控的工具链是实现产业落地的核心。

steve发布于 2025/2/6更新于 2026/6/1123 浏览
2023 中国大模型落地应用案例集核心洞察

2023 中国大模型落地应用案例集核心洞察

近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023 大模型落地应用案例集》(以下简称'《案例集》')。作为首部聚焦落地应用的权威研究成果,《案例集》全面展示了大模型前沿技术和发展成果,推动了大模型为代表的人工智能技术赋能社会经济高质量发展。经专家组的多轮评审,共 52 个各自领域的典型大模型技术落地应用成功入选。

一、大模型领域中国学者的技术贡献

2022 年底 ChatGPT 的横空出世,引爆了国内外大模型的热情,各行各业的创业者已经集结在十字路口蓄势待发。从国内市场来看,目前人工智能(AI)大模型已经在各行各业'落子不断'。据公开资料不完全统计显示,国内大模型的发展路径是'通用 + 垂直'两条腿走路,其中垂类大模型落地速度最快。《案例集》显示,有近 65%+ 的 AI 大模型是垂直大模型。

1. 底层原创技术的突破

在大模型领域细数中国学者贡献,许多原创性贡献来自本土。已故的商汤科技创始人汤晓鸥在 2023 世界人工智能大会上发表演讲时表示:在深度学习的大门上,我们按了 18 次门铃,取得了许多跨时代的突破。

深度残差学习(ResNet) 2016 年,来自微软亚洲研究院的四位学者提出深度残差学习(ResNet),解决了深度网络的梯度传递问题。要知道,2015 年之前深度学习最多只能训练 20 层,ResNet 之后,就可以有效地训练超过百层的深度神经网络。这为后续深层模型的构建奠定了坚实基础。

Transformer 架构的改进 2017 年 Google 发布 Transformer,它的出现打稳了 AI 大模型的'地基',不仅'颠覆'了自然语言处理(NLP)中的机器翻译任务,而且还提供了一种新的思路来处理图像数据。中国学者也围绕 Transformer 做了许多改进和完善:

  • LONGNET:微软亚洲研究院联合西安交通大学推出,将 Transformer 的序列长度扩展 10 亿+。
  • 遥感视觉 Transformer:京东探索研究院联合武汉大学提出全球首个面向遥感任务设计的亿级视觉 Transformer 大模型。
  • FMViT:阿里达摩院提出新的 Transformer 结构,大幅度提升 AI 模型精度与速度。

开源体系与超算集群 林达华设计的计算机视觉开源算法体系 OpenMMLab,目前已经成为国际上最具影响力的视觉算法开源体系。值得一提的是,林达华也是书生大模型体系的重要贡献者。 京东探索研究院早在 2021 年年初就展开了大模型体系(超级深度学习)的建设和基础研究,领导京东建设了中国第一个 NVIDIA DGX Superpod 天琴 alpah-α超算集群。在此基础上,京东探索研究院的织女模型 vega v2 在 2022 年登顶 SuperGLUE 榜首,一举超越同场竞技的谷歌、微软、Meta 等业界顶尖企业;2021 年研究院开发的大规模视觉模型 ViTAE,在 ImageNet Real 的目标识别和 MS COCO 的人体姿态估计等权威榜单上均获得世界第一。

因此,国内公司的 AI 大模型研发虽然比国外公司晚,但是发展却异常地迅速,其内在逻辑便是:本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代,他们靠着持续的探索和努力才能构建出秀丽的'上层建筑'。

2. 早期布局与参数竞赛

在 OpenAI 发布 ChatGPT 之前,国内的一些企业就已经押注 AI 大模型技术:例如 2021 年 4 月,华为云联合循环智能发布盘古超大规模预训练语言模型,参数规模达 1000 亿;2021 年 6 月,北京智源人工智能研究院发布了超大规模智能模型'悟道 2.0',参数规模达到 1.75 万亿;2021 年 12 月,百度推出 ERNIE 3.0 Titan 模型,参数规模达 2600 亿,同期,阿里巴巴达摩院的 M6 模型参数达到 10 万亿,将大模型参数直接提升了一个量级。

到 2023 年,大模型继续火热,国内的 AI 大模型团队已逐渐拓展到视觉、决策领域,甚至用于解决蛋白质预测、航天等领域的重大科学问题,阿里、京东、OPPO 等大厂都有相应的成果。

二、大模型应用拐点已至

图灵奖获得者 Yann LeCun 说过:AI 大模型的技术都是公开的,算不上底层技术上的创新,如果你愿意一探究竟的话,可以发现它背后没有任何秘密可言。但借着这些'过时'的技术,在中国拥有庞大的人才基数和数据集的情况下,可以发展出更适合本土环境和语境的大模型。

那么如何形象理解大模型?前科技部长王志刚从高维度表示,大模型就是大数据、大算力、强算法。形象一些:大模型事实上就是算法、数据、算力上的有效结合。传统巨头在大模型领域的技术投入普遍都是在积极防御,而中国企业在非常积极地推动向应用中的落地。

目前,业界除了把 AI 大模型商业落地模式统分为 toB 和 toC 之外,在市场划分上则遵循通用与垂直两大路径,两者在参数级别、应用场景等方面差异正在显性化。

1. 通用大模型格局

通用大模型往往是指具备处理多种不同类型任务的 AI 模型,这些模型通常是通过大规模的数据训练而成,能够在多个领域和应用中表现出良好的效能。大家耳熟能详的几个通用大模型均来自财力雄厚的企业:

  1. 书生浦语开源大模型:由上海人工智能实验室研发,涵盖 70 亿参数的轻量级版本 InternLM-7B,以及 200 亿参数的中量级版本和 InternLM-20B,以及完整的开源工具链体系。InternLM-7B 在包含 40 个评测集的全维度评测中展现出卓越且平衡的性能,它在两个被广泛采用的基准 MMLU 和 CEval 上分别取得了 50.8 和 52.8 的高分,开源一度刷新了 7B 量级模型的纪录。
  2. 昆仑万维天工大模型:'天工'是一个 AI 搜索引擎,一个对话式 AI 助手。'天工'拥有强大的自然语言处理和智能交互能力,能够实现个性化 AI 搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
  3. 通义千问 2.0:由阿里云研发的超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均比上代有显著提升。
  4. MiniMax-abab:由科技创业公司 MiniMax 研发。据悉,'Max-abab'是文本、语音、视觉三模态的千亿参数大语言模型,在中、英文服务领域均已超过 GPT-3.5 的水平。今年 8 月份,'MiniMax-abab'大模型通过了国家首批大模型服务备案,面向社会公众提供服务。
  5. 言犀基础大模型:由京东科技研发,该模型融合了 70% 的通用数据和 30% 的数智供应链原生数据,具有更高的产业属性。
  6. 百灵语言大模型:由蚂蚁集团基于 Transformer 架构研发。该模型基于万亿级 Token 语料训练而成,支持窗口长度达 32K,在主流推理类榜单中排名前列。据悉,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,正陆续向公众开放。

这些通用大模型包含千亿甚至万亿参数,覆盖自然语言处理、图像识别、语音识别等方面的任务,已在知识问答、医疗咨询、娱乐领域、视频生成等数十个行业场景领域,展现出广阔的落地应用潜力。

2. 垂直大模型趋势

与通用大模型相比,垂类大模型参数量相对较小。但是因为有一些行业的核心数据和业务系统的生产数据参与,所以在相应行业解决问题更为高效、直接。

从《案例集》来看,在金融、教育、医疗等领域,已经有不少公司发布了相应产品。根据《案例集》入选案例的应用场景,垂类大模型更针对于企业级应用场景的垂直性和专业性要求,而在模型部署层面,更少的模型参数、训练数据意味着更少的成本,因此垂直应用领域有望实现'万模齐发'。

《案例集》公布的名单,也恰恰验证了目前垂类大模型发展的一些趋势:

  1. 加注端侧、边缘侧应用:轻量化参数能让手机助手接入 AI 大模型能力。目前已有案例包括 OPPO 的小布助手、华为的智能助手小艺等等。
  2. 更倾向于'解决方案'式的交付方式:由于垂类大模型接受了大量特定领域的数据和知识,因此可以基于领域知识生成更具深度的解决方案。例如 ChatDD 新一代对话式药物研发助手,面向游戏行业的图像内容生成式大模型等等。
  3. 大模型开始向多模态领域发展:多模态意味着丰富的数据形式,包含视觉、听觉和时序信息。对于大模型来说,这意味着可以从多模态中提取和学习更多维度的信息。类似于《案例集》中的单晶炉自动化工艺识别多模态模型,相信未来将会出现更多。
  4. '通用 + 垂直'模型互相融通:随着 AI 技术的发展,不同类型的模型之间的界限变得越来越模糊。例如,一些通用模型开始整合垂直领域的知识,而一些垂直模型也开始利用通用模型的技术来增强其功能。例如百川大模型在娱乐领域的应用。

三、抢滩大模型未来:构建生态

对于 AI 大模型这种划时代的超级机遇而言,胜负不在于做出一个爆款应用,赚到几亿盈利,而在于,是否抓到了大时代的方向。换句话说,当下的大模型竞争早已超过了技术的范畴,更多是一种生态层面的比拼,具体表现在有多少应用、有多少插件、有多少开发者以及用户等。谁能够率先围绕大模型构建生态,或者说谁率先融入生态,谁就能成为领先者。

大模型要想像电力一样输送给千行百业和千家万户,必然需要一个体系化的产业生态,构建这个生态需要一系列相互关联的因素,包括技术发展、应用场景、数据管理、伦理与法律问题、以及社会影响等。

1. 生态建构的两派路径

在生态建构的路径上,目前企业可分为两派。一派将大模型接入原有的产品线,做升级和优化;另一派试图以大模型产品为中心,建构新一代的'超级应用'。而有些企业试图跳过这两种路径,多方面融入 AI 大模型生态。

从《案例集》公布的大模型服务类案例,我们可以看到有些中国企业做了以下尝试:

  • 蚂蚁集团:实现了一个大模型数据高效高质量供给平台,不仅可降低数据获取和使用成本,且保证来源合规,并能够有效提升数据质量、过滤风险数据保障训练安全。
  • 优刻得:开发的 AGI 云上模型服务平台,能提供数据标准化整合、安全合规、提供算力等服务。
  • 上海道客:研发的云原生大模型知识库平台能够帮助解决信息孤岛,以及定制个性化的私人语料库。
  • 泡泡玛特:AI 整合平台集成多个知名 AI 大模型,为用户提供一站式 AI 服务。

2. 解决关键挑战

这些大模型服务工具,在一定程度上能有效地解决'幻觉'、'道德'、'性能'、'数据合规'等当前 AI 大模型遇到的问题。更重要的是借助这些服务,可以建设规范可控的自主工具链,帮助 AI 企业探索'大而强'的通用模型,助力公司研发'小而美'的垂直行业模型,从而构建基础大模型和专业小模型交互共生、迭代进化的良好生态。

3. 未来展望

随着技术的成熟,大模型将不再仅仅是技术名词,而是成为基础设施的一部分。未来的竞争将集中在谁能更好地将技术与实际业务场景结合,谁能提供更稳定、更安全、更低成本的模型服务。同时,数据隐私保护、算法可解释性以及社会责任也将成为衡量大模型企业的重要标准。中国企业在这一进程中,凭借庞大的数据资源和丰富的应用场景,有望在全球大模型生态中占据重要一席。

综上所述,2023 大模型落地应用案例集不仅是对过去一年的总结,更是对未来方向的指引。通过梳理底层技术、中层模型和上层应用,我们可以清晰地看到中国大模型产业的完整图谱。从 ResNet 到 Transformer,从通用模型到垂直模型,每一步都凝聚着中国从业者的智慧与汗水。面对未来,构建开放、协作、规范的生态将是持续发展的关键。

目录

  1. 2023 中国大模型落地应用案例集核心洞察
  2. 一、大模型领域中国学者的技术贡献
  3. 1. 底层原创技术的突破
  4. 2. 早期布局与参数竞赛
  5. 二、大模型应用拐点已至
  6. 1. 通用大模型格局
  7. 2. 垂直大模型趋势
  8. 三、抢滩大模型未来:构建生态
  9. 1. 生态建构的两派路径
  10. 2. 解决关键挑战
  11. 3. 未来展望
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 比迪丽 AI 绘画多设备协同:PC 生成、手机审核与平板标注工作流
  • DeepSeek 深度使用指南:提示词工程与本地知识库搭建
  • 2024 开源图生视频模型横向评测:从 Stable Diffusion 到 SVD 的技术选型指南
  • 二分算法:8 道经典题目详解与实战
  • OpenClaw 漏洞预警:如何为 AI 代理构建日志审计防线
  • OpenClaw 跨平台安装指南:Windows、macOS 与 Linux 全方案
  • 基于 UDP 协议的手机通话语音局域网传输 Python 脚本
  • Python 流程控制
  • Ollama 模型管理与删除、Open-WebUI 开启大模型交互
  • 工业机器人工具坐标系与多传感器标定实战指南
  • MaxBot 抢票机器人快速部署与配置指南
  • GitHub 图片显示问题解决方案:本地引用与跨平台兼容
  • Vitis 从零实现 AI 模型 FPGA 部署实战
  • Coze 全解析:100 个落地用途及发布指南,低代码 AI 智能体入门
  • GitSync:Android 平台 Git 仓库同步工具解析
  • VSCode 搭建 Java + Maven 开发环境
  • 本地 Ubuntu 服务器部署 OpenClaw 完整教程
  • AI 在医疗健康领域的应用开发与实践
  • AI 视频生成工具清单及免费说明
  • C++ Qt 窗口框架与菜单栏 QMenuBar 使用指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online