跳到主要内容 中国工业大模型行业发展研究报告 | 极客日志
Python AI 算法
中国工业大模型行业发展研究报告 工业大模型作为大模型技术在工业领域的延伸,目前处于萌芽阶段。文章分析了大模型的概率模型本质及其不可解释性、幻觉等特征,指出工业互联网积累的数据资产为大模型落地提供了基础。市场玩家多为原有工业互联网平台厂商,切入点在于自身技术或行业优势。商业模式目前以定制化解决方案为主,API 调用等模式尚在探索。文章探讨了大小模型并存协同的关系,认为平台化服务是未来趋势。主要挑战集中在模型缺陷、数据质量、应用深度及商业化变现。短期内技术优势重要,长期看行业 Know-How 与应用深度更为关键。
GopherDev 发布于 2025/2/6 更新于 2026/4/20 1 浏览
概述 工业大模型伴随着大模型技术的发展,逐渐渗透至工业领域,目前处于萌芽阶段。就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型。其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此当前大模型具有不可解释性和幻觉不可消除等主要特征。
就大模型落地工业的情况而言,工业互联网、工业智能制造等工作已经让部分工业企业遍历了数据采集 - 数据存储 - 数据处理 - 数据分析 - 数据资产沉淀 - 数据应用的过程。部分场景已经准备好了向基础大模型投喂的'数据原料',当经过简单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。
就工业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值。而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。
市场玩家与切入路径
玩家重合度高 工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
就参与玩家而言,大模型技术底蕴、行业 Know-How、运维资源等方面是各类玩家主要锚定的优势,且都是基于自身优势点,围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。
产品形态与服务 就具体产品形态而言,整体还较为稚嫩,目前大模型的能力更多还是依附于已有产品体系,鲜少有独立的产品出现。未来随着大模型流量入口特性明朗,有望独立成产品。
就应用场景而言,当前大模型的不可解释性和幻觉等特性,与工业'0 容错'的特性相悖,因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景(如知识问答、辅助设计/代码生成等),而生产制造等核心场景的探索需要静待模型进化以及 CV 大模型、多模态大模型的发展。
发展挑战 就发展挑战而言,模型、数据、应用、商业变现是无法避开的话题,且各方相互影响,互利共赢。
AI 与大模型本质解析
AI 通用技术框架 AI 本质就是一系列参数化的函数所组成的计算系统,并在一定的框架环境下,进行数据计算和参数调优的过程。整体来看,AI 通用技术框架主要分为基础层、技术层、应用层三层。不同公司在整体框架上都保持一致,只不过针对基础层和技术层的部分内容划分略有区别,但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑,最终达到模型运行并输出结果的目的。
基础层和技术层的 AI 框架和算法/架构上,其玩家比较类似,主要是国内外领先的科技巨头、云厂等参与,如谷歌、Meta、微软、亚马逊、阿里、百度、华为等。
应用层和技术层的工具组件、通用技术,其玩家更加百花齐放,针对行业、场景、功能等各角度发力,推动 AI 工具和应用的落地。当前,大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。
大模型能力获取 大模型是从海量数据中学习并记住泛知识后,在域内数据 + 提示数据集的修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型。
据 Andrej Karpathy 所言,大模型本质由巨大的参数文件 + 运行参数的代码文件两大核心组件构成。其中:
参数文件是通过大量数据训练获得的,代表从数据中提取的有用信息和模式(可称为'知识'),其参数量与对知识的记忆能力,与数据量、数据按照不同说明进行曝光的次数有关。
代码文件有点类似'大脑',主要是指导参数文件进行推理和产出,其中,可根据域内数据、提示数据集等进行调参,不断提升模型的准确性。
针对大量数据进行预训练,让大模型学习并记住知识;
明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;
通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;
强化学习。
以上,也说明大模型的能力不是只要参数量足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。需要注意的是,大模型本质是一个概率模型,可从 2 个角度理解:
具有不可解释性:虽然可以调参,但是并不知道这些参数在做什么,如何协同工作,表示的是什么意思;
幻觉不可消除:模型的工作机制是基于概率和统计推断进行的,而非真正的理解和逻辑推理,且与预训练的数据量、曝光次数、微调数据量及数据的选择、奖励函数偏好等息息相关。
工业应用可行性分析
数据基础具备 大模型的本质是由一系列参数化的数学函数组成的计算系统,是人工智能系统对知识的一种表示和处理方式,本身就具备'数据喂养—认知构建'的'学习'能力。因此,在已经学习海量通用数据、具备一定泛化能力的基础模型的基础上,向其'喂养'特定行业/场景的数据及规则,经过定制开发、调整、训练、调优等操作后,该基础模型将获得特定行业/场景能力的'认知能力',在一定程度上可称为特定行业/场景大模型。
就工业领域而言,工业互联网、工业智能制造等工作,已经让部分工业领域企业遍历了数据采集 - 数据存储 - 数据处理 - 数据分析 - 数据资产沉淀 - 数据应用的过程,部分场景已经准备好了向基础大模型投喂的'数据原料'。当经过数据处理、适配、微调,甚至是训练后,逐步演进为工业大模型,可以解决部分垂直细分场景问题,大模型落地工业成为可能。
产业格局与商业模式
厂商类型与优势
互联网大厂、ICT 企业、AI 厂商,强调 AI 原生能力和基础大模型能力;
传统软件厂商凸显客户服务经验、运营资源优势;
制造大厂、机器人厂商彰显行业 Know-How、行业数据、设备应用等优势;
安全厂商侧重在企业全局运维中的安全保障。
综合来看,虽然各家优势有异,但切入市场的策略相似,即:锚定自身优势点,围绕具体应用场景摸索大模型在工业的落地性,且目标都是有钱、技术底蕴、有意愿的头部客户。当前,对比国内外企业的市场切入思路,主要差异有二:
在合作方上,国外企业具有资源顶端优势,强调从算力底层出发,构建算力 - 推理的能力地图,而国内企业则强调底层大模型的能力与丰富性;
在服务思路上,国外企业相对更强调将数据链路服务体系做深,而国内企业更强调各功能模块间的组合。
产业链价值流转 上游服务方整体集中,且头部效应明显;中游市场参与玩家众,虽服务能力各有侧重,但结合行业 Know-How/行业数据积累进行基础大模型微调、RAG(检索增强生成)是主要服务思路;下游市场需求广阔,但尚处于探索阶段。
商业化模式 定制化综合解决方案是当前核心收费模式,更多收费模式可能需探索。大模型落地于工业领域尚处于萌芽期,其产品形态、服务内容都还在逐步摸索中,其变现方式虽有一些相近服务或行业可以参考,整体不确定性非常高,但一切尝试也都有意义。
工业大模型供给方常规的做法是:与基础大模型厂商合作 - 测试大模型特点、性能 - 结合自身产品/能力进行微调 - 根据客户需求进行客制化服务。因此,目前相对比较确定的变现方式是类似于'保姆式'的针对某个场景/具体功能的综合解决方案服务收费。除了定制化的解决方案收费外,部分供给方也开始尝试通过软硬件一体产品进行补充收费。
虽然一些基础大模型的厂商 API 调用是目前较为普遍的变现方式,但深入到工业大模型服务领域,API 调用、智能体调用及分发抽佣等方式的变现还处于积累阶段,目前市场还需要验证。
值得注意的是,大模型的能力具有很强的进化性,例如 OpenAI 推出的 o1 版本表现出比较强的复杂推理能力,这是人工智能新水平的一个重要进展。因此大模型未来的能力极限在哪里,我们尚未可知,大模型能为工业领域带来哪些类型的赋能和服务,同样也未知。正是这份未知,未来工业大模型的变现将存在诸多可能。
成长路径与产品架构
成长路径 工业大模型市场还处于非常初期的阶段,大模型能力更新迭代快,还有非常多尚未可知的潜力,故工业 + 大模型的应用可能也有无限想象空间。工业大模型的成长路径可借鉴与参考工业互联网平台的,主要原因有 2 点:
二者在客户定位、服务内容、服务目标等各方面的重合度比较高;
当前阶段,工业大模型表现出来的能力,更像是在工业互联网平台的基础上,对数据信息价值的挖掘进一步深入和易用化,服务思路是一致的。
大模型能力具有进化性;
工业大模型市场仍处于产品雏形期,很多能力仍然停留在产品设想与理论实验阶段,尚未进入真正的工业实践。
因此目前急需解决的是产品 - 项目的积累与闭环链路构建,打牢基础后,项目 - 平台及生态才有机会逐步验证。
产品服务架构 大模型落地工业领域的服务框架依然分为基础底座 - 模型及服务 - 模型应用三层。其中,模型及服务是核心,主要提供两大类型的服务:
提供预训练模型,可供其他企业通过调用/部署,提供基础的大模型能力;
提供预训练模型后服务,如辅助微调、提示工程、训练、压缩、优化等,可供模型能力进一步适配与适用。
当前,工业大模型市场的模型应用都是在大模型的基础能力 + 模型的适配与适用的基础上进行定制衍生的。
产品落地模式 目前大模型落地工业时的产品切入角度主要有 5 大类:基础底座、工具、软件服务、硬件产品、硬件赋能。
基础底座与工具 :主要由一些基础模型厂商提供,具有较强的头部效应,未来随着大模型能力的提升,有助于赋能软件开发、测试等全流程,以及硬件端的具身智能。
针对具体应用时 :以一些工业互联网平台厂商推出为主,但各方尚在探索大模型与自身产品及服务的结合点,产品形态还较为稚嫩,多以基于通用大模型进行微调、RAG 验证后形成自己的大模型,然后依附于已经存在的产品(如工业 APP)上,单独形成具体应用产品的并不多。未来,随着大模型能力稳定性、准确性提升,大模型有望成为新的流量入口,独立成一个新的产品的也并非不可能。
应用场景与挑战
应用场景
大模型无法保证输出的准确性,故当前有容错能力的场景是各家探索重点;
大模型的应用无法脱离行业 Know-How 的加持,基本是都是通过微调或者 RAG 技术进行调整,故掌握着丰富工业数据、工业机理模型的企业在工业领域将更有优势;
目前还是以分析和预测为主,决策还是非常初级的辅助决策,未来控制和应用决策能力的发展需要充分发挥时序数据(如设备、产线运转数据、监控数据等)、IT 和 OT 数据相结合后的价值,故大模型能力进化与其他类型大模型的成熟变的非常迫切。
主要挑战 大模型落地工业的挑战主要聚焦于模型、数据、应用、商业变现几方面。
针对模型 :其根本是模型本身的问题,即存在幻觉、不可解释性、成本高等问题。需要通过持续的技术迭代和约束机制来缓解。
针对数据 :更多是数据共享性、数据质量等问题。工业数据往往涉及隐私和安全,打通数据孤岛是难点。
针对落地应用 :则关乎决策成本和应用深度等问题。需要确保 AI 建议的可执行性。
针对商业化 :则与前面三大挑战息息相关,即模型与数据相互促进,模型进步将推动应用落地,应用的推进能带来更好的商业化变现。
深度思考
竞争要素 基础能力、模型能力、模型应用是主要竞争点:短期看,具有模型技术优势的企业占优,长期看,则是模型应用更深的企业有望后来居上。
大模型落地工业,本质上还是以能解决客户需求为导向。从需求方角度看,客户主要关心两点:结果准确性 + 服务于业务。因此,对于供给方而言,模型技术与业务理解缺一不可,只不过具有不同基因的企业,在基础能力、模型能力、模型应用这三方面所具备的优势不同,但这三方面是大模型落地的主要竞争要素,且不同发展阶段其相对优势也有所不同。
具体而言:从短期来看,工业大模型行业是大模型技术发展带来的,以模型技术推动行业发展为主,此时,具有技术优势的企业将占领先机;从长远来看,技术本身是为行业服务的,故具有行业 Know-How 积累的企业反而能推动行业走的更远,其相对优势将会更加明显。
大小模型关系 工业大模型与工业专用小模型并存,且是协同融合赋能工业应用的关系。
在进行工业应用时,大小模型各有所长,其能力都不可忽视,当前也不存在谁替代谁的情况。大模型落地工业应用时,主要依托于强大的生成能力和针对复杂信息的捕捉与构建能力,因此在知识问答、文本/图片生成等以创造见长的场景应用比较多。而小模型则凭借高性价比、预测结果相对准确等优势,在工业质检、设备维护等场景高度成熟。
整体来看,大小模型融合赋能工业应用是必然。原因主要有二:其一,大模型除了能有效促进小模型推理能力、鲁棒性性能提升外,还能通过调用的形式充分利用小模型,进一步发挥小模型应用的敏捷性;其二,通过小模型归纳总结业务/场景的运转原理后,可帮助供给方预判针对项目设计的大模型行动方案的可行性,进而降低项目时间和金钱成本。
服务平台化趋势 大模型落地工业的服务平台化特征已开始显现,且逐步形成垂直行业大模型 + 智能体 + 小模型 + 机理模型为主的平台化调用方案。
大模型虽然在一定程度上具有泛化能力,但具体到应用时,需要进行微调等操作,其具有很强的定制属性,如何减少重复性工作,甚至减少定制化是各供给方共同探讨的命题。而行业大模型 + 智能体 + 小模型 + 机理模型为主的平台化调用方案似乎成为大部分企业的共同选择。但有两点需要注意:
平台化强调知识沉淀、工具等调用的便捷性,而不拘泥于存储形式/路径;
大模型工业应用时,其演进具有一定阶段性,基本遵从场景 - 垂直细分行业 - 工业领域的路径。
结论 工业大模型正处于从概念验证向实际落地过渡的关键时期。虽然面临模型幻觉、数据壁垒、商业闭环等挑战,但随着基础大模型能力的不断进化以及工业数据资产的进一步沉淀,其在工业场景中的应用潜力巨大。未来,大小模型协同、平台化服务以及垂直领域的深度定制将成为主流发展方向。企业应抓住机遇,结合自身优势,积极探索适合自身的落地路径。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
curl 转代码 解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online