2024 年中国 AI 大模型产业发展报告深度解读
引言
伴随人工智能技术的加速演进,AI 大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。其发展潜力巨大,应用前景广阔,正深刻重塑着各行各业的业务模式与生产关系。
日前,人民网财经研究院与至顶科技联合发布了《开启智能新时代:2024 年中国 AI 大模型产业发展报告》(以下简称《报告》)。该报告对 AI 大模型产业的发展背景、现状、典型案例、挑战及未来趋势等方面进行了系统全面的梳理,旨在为政府部门决策、行业从业者规划以及社会公众认知提供有价值的参考依据。
一、政策、技术、市场驱动产业发展
1. 政策顶层设计持续完善
近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项支持政策以推动产业落地。国务院于 2017 年发布《新一代人工智能发展规划》,确立了人工智能发展的战略目标。科技部等六部门于 2022 年印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,进一步落实规划要求。2024 年《政府工作报告》明确提出开展'人工智能+'行动,标志着 AI 从技术探索走向全面赋能实体经济的关键阶段。
2. 地方政策因地制宜发力
伴随人工智能领域大模型技术的快速发展,我国不少地方政府出台相关支持政策,加快大模型产业的持续发展。当前,北京、上海、广东、安徽、福建以及深圳、杭州、成都等地均发布了针对性的 AI 大模型产业政策。这些政策通常涵盖算力补贴、数据开放、应用场景试点及人才引进等多个维度,形成了全国范围内协同发展的良好格局。
3. 市场需求倒逼技术迭代
《报告》认为,中国 AI 大模型产业发展源于多领域的广泛需求。例如来自办公、制造、金融、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国 AI 大模型产业的蓬勃发展,预示着未来更广阔的市场前景。企业对于智能化转型的迫切需求,成为了大模型技术落地的核心动力。
二、中国 AI 大模型产业呈现蓬勃发展的态势
1. 部署方式分类清晰
《报告》对目前的 AI 大模型按照部署方式进行了划分,主要分为云侧大模型和端侧大模型两类。具体而言,云侧大模型分为通用大模型和行业大模型;端侧大模型主要有手机大模型、PC 大模型。这种分类反映了不同场景下对算力、延迟、隐私及安全性的不同权衡。
2. 商用落地成果显著
伴随多家科技厂商推出的 AI 大模型落地商用,各类通用、行业以及端侧大模型已在多个领域取得了显著的成果。如在金融、医疗、政务等领域,AI 大模型已成为提升服务质量和效率的重要手段。通过自然语言处理、知识图谱等技术,大模型能够辅助医生进行诊断建议、帮助银行进行风控审核、协助政府进行公文处理。
3. 代表性模型生态初具规模
我国具有代表性的通用 AI 大模型主要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等;行业 AI 大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT 大模型;同时具有云侧和端侧大模型的端云结合 AI 大模型主要有 vivo 的蓝心大模型;端侧 AI 大模型主要以蔚来的 NOMIGPT 大模型为代表。这些模型在参数量、训练语料、推理速度等方面各有侧重,构建了丰富的产品矩阵。
三、中国 AI 大模型产业发展仍存多方面挑战
尽管发展迅速,但大模型产业在迈向成熟的过程中仍面临多重瓶颈。
1. 算力瓶颈制约规模化
大模型产业遭遇算力瓶颈。随着 AI 大模型规模呈现指数级增长,训练大模型越发依赖高性能 AI 芯片。国内 AI 高性能芯片市场受进口限制和国内技术瓶颈的双重影响,大模型产业发展受到算力层面的一些制约。高性能 GPU 的供应稳定性、HBM 内存的产能以及互联带宽都直接影响训练效率和成本。
2. 主流架构存在局限性
主流大模型架构仍存在诸多局限。首先,Transformer 架构消耗的算力资源普遍较大,随着序列长度增加,计算复杂度呈平方级增长;其次,基于 Transformer 架构的大模型对存储设备的要求也更高,KV Cache 的管理成为显存优化的关键难题。这促使业界开始探索 MoE(混合专家)架构、状态空间模型(SSM)等新型架构以降低开销。
3. 高质量训练数据集不足
高质量的训练数据集仍需扩展。国内的 AI 大模型数据主要来自互联网、电商、社交、搜索等渠道,存在数据类型不全面,信息可信度不高等问题。整体来看,我国可用于大模型训练的中文数据库体量严重不足,且缺乏经过清洗的高质量指令微调数据。数据质量直接决定了模型的上限,构建高质量语料库是未来的重点方向。
4. 爆款应用尚未出现
大模型爆款应用尚未出现。国内的 AI 大模型产业至今没有出现爆款级应用,原因在于尚未找到商业化思路,缺乏满足客户需求的个性化应用。我国大模型产业要推出爆款级应用,势必要在应用领域做深做细,让每一个用户都可以充分享受到大模型所带来的真正便利。目前多数应用仍停留在对话机器人或简单内容生成层面,深度集成工作流的应用较少。


