跳到主要内容 AI 大模型重塑物流业:行业实践与架构演进 | 极客日志
编程语言 SaaS AI 算法
AI 大模型重塑物流业:行业实践与架构演进 本文探讨了 AI 大模型在物流行业的应用现状与挑战。物流 CTO 们在闭门会上达成共识,明确了跟随与主导模式的边界,强调定位清晰的重要性。商业化方面,AIGC 在营销设计与客服对话场景已初见成效,但成本仍是大规模商用的主要障碍。针对大模型幻觉问题,行业呼吁构建垂直行业大模型并结合 RAG 技术提升准确性。架构演进上,云原生被视为开启数字全球化的关键,通过混合云、Serverless 及异地多活架构,企业可实现弹性伸缩与高可用,有效支撑 AI 业务落地。同时,行业对具备大模型工程化能力的人才需求激增,薪资水平持续走高。
2024 年已进入 AI 大模型应用元年,AIGC 正以席卷之势重塑着原有的应用、流程与业务。真正将产业化应用做得越来越深的,不在于理论的高深,而在实际场景的落地。
近日,中通、圆通、申通、韵达、中远海科、东航物流等物流企业的 CTO 与 CIO 们齐聚上海,举行了一场行业技术闭门会议。这些 CTO 们堪称行业技术核心力量,他们正处在不同的阶段——有的在 AI 大模型与小模型间取舍,有的正推进 AI 大模型商业化,有的已朝着垂直场景 AI 大模型做迭代创新。
闭门会上,物流行业最懂 AI 大模型的这批人有共识也有争论。有对上云的权衡和犹豫、有对 AIGC 创新场景的发掘,也有对 AI 大模型应用落地的朴素担忧。好几位 CTO 的笔记都写满了几页纸。本次会议纪要摘录了这场激辩中最深刻的要点,供行业参考。
01 面对 AI 大模型,CTO 必须明确哪些用跟随模式、哪些用主导模式 物流行业 CTO 们普遍在聊这样的现状:当 AI 大模型热起来时,老板、CEO 或投资人们会问:'大模型这么火,我们为什么不用?我们会不会被颠覆?'当他们想做大模型立项时,老板们可能又会问:'我们为什么要用?成本很高,你再想想。'
面对 AI 大模型浪潮,CTO、CIO 们是企业里对技术最了解的一批人,也是对公司业务最了解的一批人。来自前沿实践者的经验是:CTO 们应该规划好哪些是跟随模式?哪些是必须自己主导的?哪些用基础模型?哪些找合作伙伴,哪些可能商业化?
定位越清晰,能力越到位。当 CTO 们知道自己承担什么角色,AI 大模型焦虑问题、投入问题、产品路径以及如何证明自己的问题都会迎刃而解。
在模型选择上,不少物流企业从厂商信赖感、模型服务、数据安全等多方面考量,选择了国产 AI 大模型。他们认为除了基础 AI 大模型的选择之外,同样重要的还有基础测试库。用户会问什么问题?AI 大模型给出的回答跟规划的答案是否一致?拉通测试库跟底层模型联调优化后,开发节奏就拉起来了,CTO 和 AI 大模型厂商的分工协同、用户迭代也就水到渠成。
此外,对于通用能力强的任务(如客服问答、文档摘要),建议采用跟随模式,直接调用成熟 API;而对于涉及核心数据隐私、特定业务流程优化的任务,则应主导开发,构建私有化部署的小模型或微调模型,以确保数据不出域且响应速度满足业务 SLA。
02 物流行业的 AI 大模型商业化探索 对于内部提效和挣钱这两件事,所有 CTO 都没有分歧。
他们正在敏锐地发掘并激活产业链上的关键节点,迅速实现技术商业化的闭环,甚至坚定地设立了 AIGC 商业化的专职团队,进而带着技术团队,从中台部门转为一家'创业公司',用创业的方式为企业探索另一条增长曲线。
G7 易流首席科学家王守崑介绍,G7 易流很早就在关注 AI 大模型领域的进展和可能的应用场景。在他看来,用 AI 大模型生成文章、图片等用于营销场景,是目前最成熟的、质量相对有保证的。
还有一些 CTO 分享了 AIGC 在平面设计场景的应用。物流行业 to C、to B 的线上营销活动非常频繁,需要设计大量广告图。而传统素材库往往会忽略快递车、物流车、司机等素材,现有素材也因摆拍感过重、过于精致而难以贴合实际场景。为了解决这个问题,有些敏锐的物流企业开始实拍送货小哥,再用 AIGC 调整人物外观,如增粗眉毛、调整皱纹等,生成多个设计素材。
对于一家商业组织而言,设计最大的难点不在设计本身,而在于设计师和负责营销的运营人员的理念差异。借助 AIGC 工具,运营人员可以直接参与设计,想生成什么风格就生成什么风格,更精确地实现视觉目标,而不仅仅是简单地提高设计效率。
王守崑认为,AI 大模型在物流行业的第二类应用就是客服的对话式 AI,可应用于发货、运维、报修、查询等场景,比如用文本生成 SQL 去做订单查询。这能显著降低人工客服压力,提升响应速度。
第三类是 AI 专业助手。不同系统、不同平台、甚至微信群的订单单据格式不一样,为此 G7 易流上线了物流接单助手,接入 AI 大模型后不管什么订单格式都能快速统一对接;此外 G7 易流还做了安全小助手,提醒司机、安全员关注驾驶风险。
类似沟通助理这样的产品正在被多家物流企业寻找种子用户、打磨产品、收集测试反馈、开展商业化试点,对业务效率的提升已初见成效。未来,随着多模态能力的增强,AI 助手将能直接处理图像识别的运单、语音交互的调度指令,进一步打通信息孤岛。
03 在成本问题解决之前,AI 大模型无法大规模商用 申通 CTO 赵柏敏认为,AI 大模型解决了通用性的问题,但并没有解决成本的问题。如果 GPU 计算资源、能耗等成本问题不解决,AI 大模型在大部分领域都无法大规模应用。他希望 AI 大模型成本,至少推理成本降下去。
中通快递 CTO 杨文深表示认同。他表示,中通测试过智能客服等场景,AI 大模型体验更好,但用既有的通用 NER 小模型基本也能满足需求。
以中通一直在尝试的数据治理为例,用公共云的 AI 大模型效果很好,但成本很高。所以中通又自建了一个向量数据库,基本上也能达到使用目标。这种混合策略——敏感数据本地处理,非敏感数据云端调用——是许多企业当前的主流选择。
中通技术部门面临着一个可能是大部分物流企业产研团队都会遇到的诉求——报表治理。为此中通选择了用传统的方法做归因分析,再加上 AI 大模型的方式简化报表。通过自然语言查询数据(ChatBI),业务人员无需编写复杂 SQL 即可获取洞察。
在路由规划等物流行业专业的需求领域,传统的运筹规划等方法更有效;面向新领域的需求则使用 AI 大模型探索。这是因为运筹学算法在确定性约束下表现更优,而 AI 擅长处理模糊信息和长尾场景。
为了降低成本,业界也在探索模型量化、知识蒸馏等技术,将大模型压缩至边缘设备运行,减少云端推理开销。同时,利用 Serverless 架构按需分配算力,避免闲置资源浪费,也是控制成本的关键手段。
04 物流行业呼唤行业大模型 CTO 们不约而同提到了 AI 大模型的'幻觉'(hallucination)。一开始上手大模型,他们首先考虑的更多是大模型选型、商业参数、数据安全、底层生态支持等,但实操时,发现要解决的首要问题是大模型准确性,即幻觉问题。
幻觉对于前沿科研、药物设计等领域可能是有益的,某种程度上可以打破人们固有的认知,提供意想不到的解决方案。但对于物流行业而言,'幻觉'意味着不准确、不严肃、无法指导生产。如果用专业的行业问题跟大模型互动,它的回答可能都是有道理的,但是没用,指导不了生产和工作。
例如,在货物追踪场景中,如果模型错误预测了到达时间,可能导致客户投诉或供应链中断。因此,物流行业的大模型必须经过严格的行业数据训练和验证。
物流行业的 CTO 们拥有行业独特的知识、大数据产品,部分物流企业已经在阿里云上利用自有数据训练行业大模型。根据行业大模型内测表现来看,它们对物流领域专业问题的辅助和解答明显更为专业。
同样站在分叉口的还有 G7 易流首席科学家王守崑。他更感兴趣的是基础模型最终能到什么程度,因为这决定了 G7 易流跟着基础模型走,还是要痛下决心自己搞个小一点的大模型?这点目前还没有特别明确的答案。他认为基础模型的能力会更强一些,但从应用上来看,专门精调的小模型在某些特定场景表现更好。
也就是说,更多价值将从落到应用场景里的 AI 大模型上产生,而不只是由一个大模型无限泛化地去解决所有问题。从这个角度来说,手握着客户和场景的创业者,也许会比大模型创业者更早获得技术红利。构建 RAG(检索增强生成)系统,结合企业私有知识库,是解决幻觉问题、提升准确性的有效路径。
05 AI 大模型落地的最短路径:AI @ Cloud 目前头部大模型厂商的基础模型训练、对外推理服务几乎都是在云上完成。
如果物流企业希望聚焦在大模型业务落地和价值,不需要花费巨额成本和时间去重新构建基础模型,只需要基于阿里云成熟的基础模型服务或阿里云开源模型 + 云算力实现部署,通过大模型工具链快速完成 RAG、Prompt 提示词工程等,就可以实现 AI 大模型应用场景落地,探索对业务的提效。
阿里云智能集团副总裁、交通物流行业总经理李强说,曾经云计算被当作 IT 的一部分(以信息化技术的替代能力为主),而现在 IT 是云计算的一部分(端到端地提升企业的数字化和智能化能力,可以作为企业数字化、智能化的供应链,提供丰富的资源和服务能力)。这一转变的根源在于云计算范畴在不断扩大——现代化架构、大数据、容器、Serverless 等,还包含了领先的智能算力、AI 大模型服务、模型工具链、开发生态体系等。
李强认为,上云最核心解决的不仅仅是成本的问题,而是企业保持持续创新、保持与时代同步、保持商业敏态的能力。一家企业只有拥有一套先进的技术体系和人才团队,才能用好 AI 大模型、快速实现 AI 技术与业务应用的结合爆发。而云恰恰为企业便利地提供先进技术和人才体系,用云技术就相当于雇了世界上最好的技术和团队来为自己的公司服务。
这个观点也被完成了技术架构升级的 CTO 们认同。东航物流科技信息部总经理王岩介绍,东航物流因为央企背景,选择了阿里云混合云架构。到 2023 年混合云架构建设完毕时,系统稳定性及运维质量有了很大的提升,部署的可扩展性、稳定性、对 AI 能力的兼容性也都有显著提升。
混合云架构允许企业在保障核心数据私有化的同时,利用公有云的弹性算力进行 AI 训练和推理,平衡了安全与效率。对于物流这种业务波动大的行业,弹性伸缩至关重要。
06 如何建设一个迎接 AI 应用爆发的企业级架构? 贝联珠贯创始人&CEO、CCF 杰出工程师毕玄可能是全中国为数不多有资格给出这个回答的技术人之一了。他本名林昊,于 2007 年加入阿里,经历了阿里电商十多年来的技术架构演进。
他以阿里巴巴电商为例,提出中国企业级架构经历了 3 轮大演进:2007 年开始分布式架构改造,2013 年 2016 年升级为异地多活架构,2019 年 2021 年升级为云原生架构。
时间拨回毕玄加入阿里巴巴的 2007 年。彼时淘宝用的是 IBM 小型机、Oracle 商业数据库以及 EMC 集中式存储。但随着业务增长,碰到了伸缩性的天花板:不能加机器了。如果这个问题解决不了,整个淘宝就会宕机。
同时,技术团队研发进度缓慢也广为诟病。彼时的淘宝有近百个工程师,开发了同一个技术系统,每个人都可以同时改里面所有的代码。这导致了两个人同时提交代码后,代码因逻辑太复杂而无法合并。因此淘宝推出了研发团队争吵最激烈的会议——排期会,用来排当月发布计划,但这大大拖慢了研发节奏。
当演进成新分布式架构后,这个问题不复存在。分布式架构解决了大规模研发团队的并行效率问题,让业务可以快速迭代、优化。微服务拆分使得各模块独立部署,降低了耦合度,便于引入 AI 组件。
2013 年,阿里巴巴开始了新一轮架构改造。这轮升级要解决的第一个问题是水平伸缩,即如何在不加机器的前提下扛住大规模并发;第二个问题是让全阿里巴巴的服务器可以在多个地点部署。
很多人可能还记得 2013 年杭州特别热,40 度高温持续了十几天,阿里巴巴也接到了机房限电通知。这让工程师们'惊恐不已'——那个机房是数据库机房,如果断电了,整个淘宝全挂了。
这轮异地多活改造面临的最大问题是在全球没有参考对象。当历时 3 年的异地多活改造完成后,阿里巴巴架构地域级的容灾能力大大提升。这对于物流网络覆盖全国乃至全球的布局具有极高的参考价值,确保单点故障不影响整体业务连续性。
第三次架构演进发生在 2019 年到 2021 年,阿里巴巴实现了云原生架构。其标志性事件是 2021 年双 11 时,阿里巴巴的业务已全部跑在阿里云上,用户体验如丝般顺滑。在此之前,全世界还没有一家大型科技公司把所有业务都放在自家公共云上,这意味着阿里云有能力应对高难度复杂环境下的技术挑战。
阿里巴巴技术演进的经验沉淀下来,让之后很多企业做同样的技术架构升级所需的周期和成本,远小于阿里巴巴当年。基于这些经验,完成了技术架构升级的企业将有更成熟的条件去迎接 AI 大模型的应用创新。云原生架构中的容器编排(Kubernetes)能够高效管理 AI 训练任务的资源调度,实现 GPU 资源的池化和动态分配。
07 云原生是物流行业开启数字全球化的集装箱 阿里云交通物流行业解决方案总经理娄恒认为,云原生和 AI 原生正是数智企业的两大确定性技术方向。
《集装箱改变世界》曾经提出,经济全球化的基础就是现代运输体系,而一个高度自动化、低成本和低复杂性的货物运输系统的核心就是集装箱,它实现了标准化、可规模化管理,使得运输成本降低 20 倍。
云原生正是开启数字全球化的集装箱,在物流企业任何需要云的地方,都能通过快速弹性、快速部署、开源兼容等提供统一的基础设施能力。
云原生能够支持企业快速在全球化开展业务。阿里云目前拥有 30 个 Region、89 个可用区,服务 200 余个国家和地区,能为物流企业提供快速在全球开展运营的基础。跨国物流涉及复杂的合规与数据主权问题,云原生的多区域部署能力有助于满足当地数据存储要求。
而 Serverless 让技术团队可以把 90% 以上的精力聚焦在业务应用开发上,大幅简化其复杂性、提高使用体验。用云越深的企业对 Serverless 越拥抱,他们业务研发人员的占比也更高,对成本优化也更接近极致。Serverless 函数计算特别适合处理物流中的突发流量,如大促期间的订单峰值。
同时,云上原生的高可用架构让物流企业的业务架构能够应对各类突发意外,比如跨 AZ、跨 Region 的高可靠数据保护。此外,云计算的成本不断下降,过去十年里,阿里云提供的算力成本下降了 80%,存储成本下降了近 90%,企业能够以更低门槛获取云服务。
申通 CTO 赵柏敏介绍,申通是快递企业里少数全量上公共云的。传统自建 IT 需要一支专业团队运维 IDC 硬件、系统、网络等,对于很多公司来讲挑战不单单是成本,更大的瓶颈在于专业的技术团队。上云最大的好处就是将快递公司从很重的运维里解放出来。
同时,快递跟电商大促节奏密切相关。所以弹性非常关键,公共云提供了便捷的弹性缩容、扩容。此外,申通早年花了大成本组建技术团队开发中间件,随着云计算的中间件成熟度在快速提高,在阿里云上可以直接买到成熟的产品。
圆通科技副总经理周庭栋深有同感。他表示圆通跟阿里云的合作始于 2017 年,借助阿里云,圆通的基础运维成本下降,混合云架构在双 11 等大促时也提供了较好的解决方案。
东航物流科技信息部总经理王岩补充说,东航物流使用了阿里云混合云架构,因此公共云业务和专有云的联动成为需要关注的新挑战。这需要建立统一的监控和治理平台,确保混合环境下的可观测性。
至于第二个确定性方向——AI 原生,娄恒认为,物流企业已走向 AI 大模型应用'全民化'。目前物流行业的业务流程都围绕着人来设计,提效方向要么是提高人员服务能力,要么是防范人错误操作。AI 有望全面重塑一半以上的业务流程,减少人员错误操作给业务流程带来类似'收费站'的降速作用,从'辅助驾驶'进化到'自动驾驶'。
娄恒介绍,作为率先开创企业级技术架构创新的阿里巴巴,已经孕育了大量 AI 大模型应用。阿里巴巴集团智能计算研究院已上线了一款新的 AI 图片 - 音频 - 视频模型技术 EMO;通义大模型也已经在代码生成、ChatBI、智能外呼等场景有着广泛应用。
大模型岗位需求 大模型时代,企业对人才的需求变了,AIGC 相关岗位人才难求,薪资持续走高,AI 运营薪资平均值约 18457 元,AI 工程师薪资平均值约 37336 元,大模型算法薪资平均值约 39607 元。
掌握大模型技术你还能拥有更多可能性:成为一名全栈大模型工程师,包括 Prompt,LangChain,LoRA 等技术开发、运营、产品等方向全栈工程;能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;薪资上浮 10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;更优质的项目可以为未来创新创业提供基石。
可能大家都想学习 AI 大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套 AI 技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
AI 大模型学习路线汇总 第一阶段:从大模型系统设计入手,讲解大模型的主要方法;
第二阶段:在通过大模型提示词工程从 Prompts 角度入手更好发挥模型的作用;
第三阶段:大模型平台应用开发借助阿里云 PAI 平台构建电商领域虚拟试衣系统;
第四阶段:大模型知识库应用开发以 LangChain 框架为例,构建物流行业咨询智能问答系统;
第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段:以 SD 多模态大模型为主,搭建了文生图小程序案例;
第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
大模型实战案例 光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
学会后的收获 • 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求:大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据 AI 应用开发,实现大模型理论、掌握 GPU 算力、硬件、LangChain 开发框架和项目实战技能,学会 Fine-tuning 垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力:大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练的编写高质量的代码。
总结 物流业的数字化转型已进入深水区,AI 大模型是关键的加速器。从架构层面看,云原生提供了弹性与标准化的基础设施;从应用层面看,垂直行业模型解决了通用模型的幻觉与成本问题。未来,随着算力成本的下降和模型能力的提升,AI 将在物流调度、客户服务、风险控制等环节发挥更大作用。企业需提前布局技术架构与人才储备,方能在变革中占据主动。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online