中国工业大模型行业发展研究报告
概述
工业大模型伴随着大模型技术的发展,逐渐渗透至工业领域,目前处于萌芽阶段。就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型。其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此当前大模型具有不可解释性和幻觉不可消除等主要特征。
就大模型落地工业的情况而言,工业互联网、工业智能制造等工作已经让部分工业企业遍历了数据采集 - 数据存储 - 数据处理 - 数据分析 - 数据资产沉淀 - 数据应用的过程。部分场景已经准备好了向基础大模型投喂的'数据原料',当经过简单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。
就工业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值。而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。
市场玩家与切入路径
玩家重合度高
工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
就参与玩家而言,大模型技术底蕴、行业 Know-How、运维资源等方面是各类玩家主要锚定的优势,且都是基于自身优势点,围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。
产品形态与服务
就具体产品形态而言,整体还较为稚嫩,目前大模型的能力更多还是依附于已有产品体系,鲜少有独立的产品出现。未来随着大模型流量入口特性明朗,有望独立成产品。
就应用场景而言,当前大模型的不可解释性和幻觉等特性,与工业'0 容错'的特性相悖,因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景(如知识问答、辅助设计/代码生成等),而生产制造等核心场景的探索需要静待模型进化以及 CV 大模型、多模态大模型的发展。
发展挑战
就发展挑战而言,模型、数据、应用、商业变现是无法避开的话题,且各方相互影响,互利共赢。
AI 与大模型本质解析
AI 通用技术框架
AI 本质就是一系列参数化的函数所组成的计算系统,并在一定的框架环境下,进行数据计算和参数调优的过程。整体来看,AI 通用技术框架主要分为基础层、技术层、应用层三层。不同公司在整体框架上都保持一致,只不过针对基础层和技术层的部分内容划分略有区别,但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑,最终达到模型运行并输出结果的目的。
具体到不同层级的主要玩家而言:
- 基础层和技术层的 AI 框架和算法/架构上,其玩家比较类似,主要是国内外领先的科技巨头、云厂等参与,如谷歌、Meta、微软、亚马逊、阿里、百度、华为等。
- 应用层和技术层的工具组件、通用技术,其玩家更加百花齐放,针对行业、场景、功能等各角度发力,推动 AI 工具和应用的落地。当前,大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。
大模型能力获取
大模型是从海量数据中学习并记住泛知识后,在域内数据 + 提示数据集的修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型。
据 Andrej Karpathy 所言,大模型本质由巨大的参数文件 + 运行参数的代码文件两大核心组件构成。其中:
- 参数文件是通过大量数据训练获得的,代表从数据中提取的有用信息和模式(可称为'知识'),其参数量与对知识的记忆能力,与数据量、数据按照不同说明进行曝光的次数有关。
- 代码文件有点类似'大脑',主要是指导参数文件进行推理和产出,其中,可根据域内数据、提示数据集等进行调参,不断提升模型的准确性。
因此,总结来看,大模型能力获得主要有四步:
- 针对大量数据进行预训练,让大模型学习并记住知识;
- 明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;
- 通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;
- 强化学习。
以上,也说明大模型的能力不是只要参数量足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。需要注意的是,大模型本质是一个概率模型,可从 2 个角度理解:
- 具有不可解释性:虽然可以调参,但是并不知道这些参数在做什么,如何协同工作,表示的是什么意思;
- 幻觉不可消除:模型的工作机制是基于概率和统计推断进行的,而非真正的理解和逻辑推理,且与预训练的数据量、曝光次数、微调数据量及数据的选择、奖励函数偏好等息息相关。
工业应用可行性分析
数据基础具备
大模型的本质是由一系列参数化的数学函数组成的计算系统,是人工智能系统对知识的一种表示和处理方式,本身就具备'数据喂养—认知构建'的'学习'能力。因此,在已经学习海量通用数据、具备一定泛化能力的基础模型的基础上,向其'喂养'特定行业/场景的数据及规则,经过定制开发、调整、训练、调优等操作后,该基础模型将获得特定行业/场景能力的'认知能力',在一定程度上可称为特定行业/场景大模型。


