国产 AI 大模型进入“群模时代”：技术突破与产业落地

国产 AI 大模型在 2023 至 2024 年间取得显著进展，多家企业如月之暗面、商汤、阿里等发布具备竞争力的模型。行业正从通用模型向垂直领域大模型转变，重点解决数据、算力及场景落地问题。未来需加强生态建设，推动人工智能与实体经济深度融合。

时间旅人发布于 2025/2/7更新于 2026/7/2037 浏览

近期，国内多款大模型重磅消息不断，标志着国产人工智能技术进入了密集爆发期。

1. 近期大模型进展概览

3 月，月之暗面的 Kimi 升级迭代后，长文本能力达到尚未上线的 GPT-4.5 Turbo 的 10 倍，展现了在上下文窗口处理上的显著优势。

4 月，商汤科技发布的'日日新 SenseNova'5.0 多模态大模型在主流客观评测上，中文理解、知识储备、数理逻辑、代码编程等方面的能力达到了 GPT-4 Turbo 水平。

5 月 9 日，阿里云发布通义千问 2.5，据称'在中文场景模型性能赶超 GPT-4-Turbo'，同时 1100 亿参数开源模型在多个基准测评收获最佳成绩。

5 月 15 日，字节跳动正式发布'豆包大模型'，这也是国内又一家互联网巨头发布的自研大语言模型。据介绍，豆包大模型目前日均处理 1200 亿 Tokens（表示和传递信息的标识符）文本，生成 3000 万张图片。

此外，从各项指标测评来看，国内部分自研大模型亦表现亮眼。近期，全球增长咨询公司沙利文发布的《2024 年中国大模型能力评测》对国内主流的 15 个大模型进行了横评，其中，百度、腾讯、阿里等互联网大厂旗下大模型位于第一梯队，综合表现更为优异。而百度文心一言能力最为全面，五项评测维度均为优势能力，并取得四项第一。

上述种种，说明国内领先的大模型企业已取得了显著的进步，成功缩小了与国外先进水平的差距。

这让我们有理由相信在'百模大战'的下半场，会如近期腾讯研究院发布的《向 AI 而行，共筑新质生产力——行业大模型调研报告》中所说那样，在'人工智能+'政策指引下，随着国产大模型能力的提升，行业大模型将加速落地，向多模态、AI Agent 等方向发展。这就像是 AI 界的'未来城市'，充满了无限可能。

01. AI 大模型的中国竞速

如今，国产 AI 大模型已狂飙突进有一年时间。

2023 年，在 ChatGPT 爆火之后，大模型技术迅速在全球科技界掀起了一场风暴，引发科技巨头们的激烈角逐。国内的科技大厂、中小企业、科研院所亦纷纷入局，当百度'文心一言'打响'大模型的第一枪'后，阿里巴巴'通义千问'、华为'盘古'、360'智脑'、昆仑万维'天工'、京东'灵犀'、科大讯飞'星火'、腾讯'混元'、商汤'日日新'等一大批大模型陆续登场，拉开了国产大模型进击的序幕。

据了解，目前市场上的 AI 大模型按照部署方式进行划分，主要分为云侧大模型和端侧大模型。与云侧大模型主要面向产业化应用需求不同，端侧大模型主要服务于个人用户。

云侧大模型通常依托于强大的数据中心算力集群，能够支持千亿级参数的训练与推理，适合处理复杂的任务，如大规模数据分析、复杂代码生成等。其优势在于计算能力强，但受限于网络延迟和带宽成本。端侧大模型则运行在终端设备上，如手机、PC、汽车车机等，具有低延迟、数据隐私保护好、离线可用等特点，但受限于硬件资源，参数量通常较小，往往需要采用量化、剪枝等技术进行优化。

毫无疑问，在这场空前的科技浪潮中，随着多家科技厂商推出 AI 大模型并落地商用，各类通用、行业以及端侧大模型在多个领域取得了显著的成果，初步形成多元化的产业生态。

在通用 AI 大模型方面，极具代表性的大模型产品如百度'文心一言'、阿里巴巴'通义千问'等具有强大的自然语言处理能力，可以应用于多个领域，包括但不限于智能客服、智能写作、知识问答等。这些模型基于 Transformer 架构，通过海量语料预训练，掌握了广泛的语言规律和世界知识。

在行业 AI 大模型方面，蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT 大模型等都是各自领域的佼佼者。这些大模型针对特定行业的需求进行了优化和定制，能够提供更加精准、专业的服务。例如，YonGPT 大模型深耕企业服务领域，通过智能化业务运营、自然化人机交互、智慧化知识生成和语义化应用生成四大方向，为企业提供全价值链、全场景的泛在智能应用。行业大模型的优势在于结合了垂直领域的专业知识库，通过微调（Fine-tuning）或检索增强生成（RAG）技术，解决了通用模型在专业领域回答不准的问题。

在端云结合的 AI 大模型方面，vivo 的蓝心大模型是其中的代表。蓝心大模型是首个在手机端运行的开源大模型系列，通过矩阵化部署适应不同应用场景，为手机用户提供智能化服务，如智能创作、知识问答、角色扮演等功能。这种端云结合的方式使得 AI 大模型的应用更加广泛和便捷，既利用了云端的大算力，又发挥了端侧的低延迟优势。

在端侧 AI 大模型方面，蔚来的 NOMIGPT 大模型是一个典型的例子。NOMIGPT 大模型是蔚来汽车推出的智能语音助手，具有强大的自然语言处理能力和多模态交互能力，能够为用户提供更加智能、便捷的驾驶体验。车载场景对实时性和安全性要求极高，端侧模型能有效保障用户隐私并减少网络依赖。

尤其进入 2024 年以来，又有多重利好因素推动着国内大模型产业快速发展。首先是'人工智能+'行动等来自政府层面的有力支持，其次用户提升生活、工作效率的需求激增，再就是科技公司加大对 AI 领域投入资金、人力、技术研发。据国家网信办今年 4 月发布的公告显示，目前我国已有 117 个大模型完成生成式人工智能服务备案。

对此，有相关机构指出，这一势头表明国产 AI 大模型不仅在技术层面取得了突破，更在商业应用和推动社会生产力变革方面展现出巨大潜力，但同时也要看到，真正的爆款应用尚未出现，国产大模型要真正走到规模化部署依然道阻且长。

02. 深耕行业、落地行业的企业级大模型或成最优解

一项全新的技术要切实在生产生活中发挥作用，应用的场景尤为关键。

如果说 2023 年是 AI 大模型市场的百'模'争鸣，那么 2024 年则将成为国产大模型全面商业落地的元年，进入赋能千行百业的关键期。因此，如何将大模型与产业化应用无缝连接，并把大模型以高效低成本方式落地到千行百业，就成为大模型企业亟待突破的方向和自证价值的考场。

国产 AI 大模型进入“群模时代”：技术突破与产业落地

1. 近期大模型进展概览

01. AI 大模型的中国竞速

02. 深耕行业、落地行业的企业级大模型或成最优解

更多推荐文章

相关免费在线工具

03. 多维着力培育大模型发展沃土

更多推荐文章

相关免费在线工具

国产 AI 大模型进入“群模时代”：技术突破与产业落地

1. 近期大模型进展概览

01. AI 大模型的中国竞速

02. 深耕行业、落地行业的企业级大模型或成最优解

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

03. 多维着力培育大模型发展沃土

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具