AI 大模型赋能工业机器人技术解析与落地实践
探讨了 AI 大模型如何赋能工业机器人,重点分析了拓斯达科技利用大模型优化码垛、编程及测试流程的实践案例。文章指出,通过构建行业知识库、微调垂直模型及引入 RAG 技术,大模型实现了自然语言到机器人控制代码的转换,显著降低了工程师的编程时间和学习成本。同时,文中阐述了通用大模型与工业垂直模型的差异,强调了人机协作及安全验证的重要性,并展望了多模态交互及本地化部署的未来趋势,认为 AI 大模型是本土工业机器人突破成本与技术瓶颈的关键路径。

探讨了 AI 大模型如何赋能工业机器人,重点分析了拓斯达科技利用大模型优化码垛、编程及测试流程的实践案例。文章指出,通过构建行业知识库、微调垂直模型及引入 RAG 技术,大模型实现了自然语言到机器人控制代码的转换,显著降低了工程师的编程时间和学习成本。同时,文中阐述了通用大模型与工业垂直模型的差异,强调了人机协作及安全验证的重要性,并展望了多模态交互及本地化部署的未来趋势,认为 AI 大模型是本土工业机器人突破成本与技术瓶颈的关键路径。

以大模型为代表的人工智能引发的新一轮科技革命和产业变革正向纵深发展,千行百业将面临巨大的机遇和颠覆性的挑战。在工业领域,人工智能是推进新型工业化的关键变量,工业大模型的落地生根将为制造企业探索新型工业化提供全新路径。
对大多数工业搬运场景而言,码垛是一个避不开、绕不过的难题。想象中的码垛只是将货物整齐放置在一个空托盘上方便后续搬运即可,然而这个看似简单的工序背后还有诸多技术门道。
"码垛其实是一项非常复杂的任务,它有点儿类似于拼乐高,内核是结构工程相关的科学知识。"拓斯达总工程师张晓辉表示。常见的垛型有上千种,在堆叠过程中不仅要考虑到货箱的重量、体积、尺寸、形状等特征,还要根据货箱内的物品类型判断其易破损程度、承压极限,甚至是保鲜期长短等信息,同时还要考虑每一个货箱放置的位置对整体垛型结构稳定性、安全性的影响,这需要更多的设计思维和技术能力。
现在有了 AI 大模型,这项工作只需要三步即可完成:
据拓斯达首席技术专家陈金民介绍,以前在工业机器人使用过程中,数据散布在各个环节,机器人在物理世界中的状态和运动轨迹的改变需要产线工人基于自己的经验去判断。现在只需要把数据导入以阿里云通义千问大模型为底座开发的专用模型之中,大模型就能对人类的意图进行分析并向工业机器人下达指令,产线工人可以通过自然语言与工业机器人实现交互,这在很大程度上也降低了工业机器人的使用门槛。
"通用大模型就像一个优秀的工作助理,它基于庞大的互联网公开数据训练,已经能解决日常场景中 80% 的常规问题。但具体到某一个特定的行业,比如工业机器人行业,由于数据零散分布在各个环节中,且有它独特的工艺流程,只有在垂直领域进行专门的训练,才能让 AI 大模型更好地去解决剩下 20% 的专业问题。"陈金民表示。
他认为,AI 大模型的核心价值是能够让人与设备实现自然语言层面的交互。未来随着 AI 大模型向多模态方向进化发展,还可能实现语音、视频等层面的交互,甚至是设备与环境之间的交互,届时将打破工业机器人的应用边界,让其走进更多的工业场景。
走进拓斯达连平生产基地,一排排形态各异、功能多样的工业机器人正在忙碌着,它们或在模拟组装零件、或在模拟棋盘对弈、或在模拟分拣货物,灵活的动作彰显着科技的力量。据拓斯达机器人工程师曾逸介绍,这些工业机器人在生产完成后,还需经过通电测试、振动测试、系统设定、原点校准等多项测试与检验,才能正式走上产线。
在测试区,一个正在为蛋糕模具裱花的工业机器人吸引到了记者的注意。机器人工程师在电脑桌面上的对话框中输入'蝴蝶'一词,短短 30 秒,AI 大模型便给出了 4 种不同风格的设计方案,还能生成预览样图。工程师点击'确认'后,被 AI 大模型驱动的工业机器人便开始往蛋糕模具上裱花。
曾逸表示,这类六轴机器人原本主要应用于 3C、锂电、光伏等行业,现在有了 AI 大模型的加持,它也有了更大的应用空间,未来将逐渐走进一些定制化、个性化需求较高的行业场景中。像在蛋糕裱花这样的应用场景中,AI 大模型不只在用户交互、图案设计等方面找到了'用武之地',还把工程师从机器人代码编写的基础型工作中'解脱'了出来,让他们得以去做价值更高的工作。
"原本工程师需要用 20 分钟左右的时间去写代码,还需花费大量时间和精力根据现场情况做调试,现在只需要向大模型提出代码需求,再做些简单修改,5 分钟之内就能将机器人的程序调试好,既省时又省力,还能缩短工期。"曾逸感慨道。
用 AI 大模型来为工业机器人编程看似简单,实际上并不容易。"一开始我们不了解通用大模型的能力范围,通过一段时间的研究与实验才发现,通用大模型对行业的渗透度不够。涉及一些具体的问题,比如某款工业机器人产品的参数、工艺知识、编程要求等,其预训练数据并没有涉及这些内容,所以大模型也无法有效解决问题,后来选择了与阿里云团队合作,训练出了一个专用于我们工业机器人产品的模型。"陈金民回忆道。
AI 大模型让工业机器人的使用和学习成本得到了显著降低。曾逸向记者介绍说:"以往工程师编写程序时需要一页一页地翻看技术手册、指令集和一些相关文档,现在只需要通过自然语言与大模型对话,提出自己的需求,大模型就能给出相应的答案。这让原本需要一两个小时的学习任务,现在只需要半个小时即可完成。"
陈金民认为,传统 AI 技术与 AI 大模型并非相互对立的关系,而是一种进化、演进的关系。在这一轮生成式 AI 浪潮之前,工业机器人行业就已经采用了大量的人工智能技术,直至当前在来料检测、故障检测、产品质检等多个环节中依然使用的是计算机视觉等传统 AI 技术。不过,传统 AI 应用只是受限于数据、算力等方面的局限性而产生的临时性的、成本相对较低的一种解决方案。未来随着 AI 大模型的不断进化,其将在工业生产的各个环节得到更为广泛的应用。
据国际机器人联合会统计,中国 2017—2022 年工业机器人安装量年均增速达到 13%。中国已然成为世界上最大的工业机器人市场。然而,与欣欣向荣的市场盛况形成鲜明对比的是,根据国家统计局数据,2022 年、2023 年中国规模以上企业工业机器人产量增速分别为 -4.8% 和 -2.2%。工业机器人四大家族(瑞士 ABB、德国库卡、日本发那科、日本安川电机)市场销量依然居前,企业份额占比分别为 13.3%、7.4%、6.4% 和 6.0%。
受限于成本高昂、灵活性不足、安全难保障、专业人才少等问题,本土工业机器人的应用空间尚未被完全释放。AI 大模型的出现或将成为本土工业机器人破局的关键。
从曾经以 10 万元起家、名不见经传的一家小公司,到如今营收超过 45 亿元,产品及服务覆盖亚、美、欧、非等 50 多个国家和地区的上市企业,拓斯达的成功或许很大一部分正是取决于其对市场趋势的超前洞察和对自主创新技术破釜沉舟式的探索。
拓斯达财报数据显示,过去三年,其研发投入金额已超过 4 亿元,研发人员占比接近总人数的一半。目前,拓斯达正在与阿里云合作,积极探索工业机器人与 AI 大模型的融合应用空间。"今天,在新型工业化的时代背景下,如果本土厂商能够抓住这一轮生成式人工智能浪潮带来的机遇,就有机会在特定行业、特定领域找到弯道超车的机会。"张晓辉坦言道。
一方面,以大模型为代表的生成式 AI 技术将大幅提高工业机器人的自主能力和认知能力,使其能解决复杂场景的应用难题;另一方面,它将极大地降低工业机器人的使用门槛,让更多人有机会用上工业机器人,同时也将吸引更多高端人才涌入这个创新赛道,激发产业发展。此外,AI 大模型的加持,还将提升本土工业机器人厂商在全球市场的核心竞争力,在产业未来发展上争夺更多话语权。
"我认为,反而是在工业场景中,AI 大模型会率先落地。"张晓辉表示。对于工业企业而言,由于行业整体利润率较低,AI 基础模型训练所需的算力成本、人才储备太大,要拥抱大模型光靠自己是不够的;而对于 IT 企业而言,它们缺乏对工业场景、工艺流程的深层次理解,很难把垂直领域的大模型做深、做实,因此双方协同合作是必然选择。
阿里研究院副院长安筱鹏同样认为,制造业应该是 AI 大模型应用的主战场。他指出,AI 大模型是重塑全球制造业竞争格局的新起点。未来所有的智能硬件都会被 AI 大模型所驱动。无论是何种形态的机器人、无论是何种形态的终端,其核心竞争力就在于它是被什么样智力水平的大模型所驱动。
"大模型生成代码的价值,将远远超过生成文字、图片、视频的价值,但是这个价值被远远低估了。"安筱鹏说道,"未来,中国完全有机会依托统一的消费大市场、算力服务大市场和 AI 服务大市场,像当年发展移动互联网产业一样,再次实现产业的繁荣和全球领先。"
为了实现上述目标,工业大模型通常采用以下技术架构:
针对工业场景特有的 SOP 和 API 文档,系统构建了向量数据库。当用户输入自然语言指令时,系统首先检索相关的技术文档片段,将其作为上下文输入给大模型。这确保了生成的代码符合特定机器人的语法规范和业务逻辑,减少了幻觉问题。
通用大模型虽然具备强大的语言能力,但在工业控制指令上存在偏差。通过收集历史工单、调试日志和专家经验数据,对基座模型进行监督微调 (SFT),使其掌握特定品牌机器人的指令集和异常处理逻辑。
在代码下发至机器人控制器之前,必须经过安全验证层。该层包括静态代码分析、仿真环境预演以及权限校验。只有通过了所有安全检查的代码才会被执行,防止因模型错误生成导致设备损坏或人员受伤。
未来的交互将不再局限于文本。结合摄像头和传感器数据,大模型可以实时感知环境变化。例如,当检测到货物位置偏移时,模型能自动调整抓取策略,无需人工干预。
企业在引入 AI 大模型优化机器人产线时,应遵循以下步骤:
AI 大模型正在从根本上改变工业机器人的开发和使用方式。从传统的示教器编程转向自然语言交互,不仅大幅降低了技术门槛,还提升了生产线的柔性适应能力。尽管面临数据安全、实时性和可靠性等挑战,但随着技术的成熟和生态的完善,AI 大模型必将成为智能制造的核心驱动力,推动中国制造业向全球价值链高端迈进。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online