企业如何落地大语言模型应用
以 ChatGPT 为起点,大语言模型(LLM)凭借全面的技术创新以及在用户和产业中的应用落地,再次掀起了一个 AI 新浪潮。与它的前辈们相比,大语言模型因为打通了语言这一人类沟通中介,并且仅用一个模型统一了多种复杂的任务,在对个人和公司的潜在影响力上明显更上一层楼。受到'再不努力就要被机器,或者是会用机器的人取代'趋势的威胁,越来越多中国企业开始下定决心要投身到新的 AI 热潮中去。
大语言模型正在重塑企业数字化进程。企业应用 LLM 面临的数字底座不足、流程融合难等挑战,并基于行业实践提出了六步落地框架:业务驱动、以人为本、数据准备、技术基础、生态创新及负责任 AI。重点探讨了数据安全、私有化部署及提示词工程等技术细节,强调中小企业需加速数字化转型以抓住 AI 红利,通过构建专属知识库与混合云架构实现安全可控的智能化升级。

以 ChatGPT 为起点,大语言模型(LLM)凭借全面的技术创新以及在用户和产业中的应用落地,再次掀起了一个 AI 新浪潮。与它的前辈们相比,大语言模型因为打通了语言这一人类沟通中介,并且仅用一个模型统一了多种复杂的任务,在对个人和公司的潜在影响力上明显更上一层楼。受到'再不努力就要被机器,或者是会用机器的人取代'趋势的威胁,越来越多中国企业开始下定决心要投身到新的 AI 热潮中去。
但当他们站上起跑线,只会发现事情并没有那么简单,甚至有点让人迷茫。AI 新浪潮正在倒逼企业重塑数字化底座。
造成企业'想说爱你不容易'的关键,主要有两点:
以具体的数字为例,根据全球知名专业服务公司埃森哲研究发现,自然语言任务占到了企业人员工作总时长的 62%,其中 65% 的时间可以借助人员强化和自动化技术来提升工作活动的生产力。将这两个数字直接相乘,就能得到一个简单而又直白的结论——所有行业中 40% 的工作时间,都能通过 GPT-4 这样的大语言模型实现革新。
这个数字听起来或许有些夸张,我们不妨具体到特定的产业中来看。以快消品产业链为例,大语言模型能够在产业链中应用的环节实在太多。从最基础的需求确立、产品打造、商业模式创新,到具体的市场营销,再到后续的供应链和制造管理、可持续发展以及企业内部的管理,基本上覆盖了所有的环节。
从企业和产业竞争的视角看,尤其是快消品这样互相快速模仿借鉴、竞争激烈的产业,大语言模型的应用,正在以一个全新的维度为企业带来新的竞争力。在埃森哲最近的一项技术趋势调研中,72% 的受访中国企业高管对 AI 新能力表示了极大的兴趣,并将在后续的企业经营中积极探索和尝试这项新技术。
确定了'要做',接下来的问题是'怎么做'。而这恰恰是大语言模型技术的最大挑战所在。对于本身数字底座相当充分的企业来说,探索 AI 新技术的应用能力、如何将自己的业务和内部运行模块与 AI 技术结合,是一个非常烦琐的任务。
在一次聊天中,埃森哲对媒体表示:'大语言模型时代和互联网时代的思维方式和路径,其实发生了非常多的变化。'就拿我们上面提到的'倒逼企业重塑数字底座'为例,过去互联网时代的'人工编写代码 + 数据库'的模式,正在遭受'模糊数据 + 神经网络模型'的挑战。企业在需要用大语言模型全面提升自身应用和服务能力的同时,也需要开始着手收集还未数字化的企业信息和知识积累,并将他们整理为神经网络能够理解吸收或者学习的格式、作为企业专属模型的数据输入。
而在企业内部员工的培训上,大语言模型相关的内容也正在成为刚需,尤其是员工日常使用大语言模型过程中的 Prompt(提示词)技巧。根据埃森哲服务中国企业的经验,'光是应用云计算、真正实现数字化这一点,对于很多中国企业来说就已经是革命性的了。现如今任务中多了 AI,变革的压力和难度其实变得更高。'
根据中国电子技术标准化研究院 2022 年的研究,占据了中国企业绝对主体的中小企业,79% 处于数字化转型初步探索阶段,12% 处于应用践行阶段,真正达到深度应用阶段的企业仅占 9%。很显然,大量中国企业急切需要充分理解了 AI 发展趋势、拥有打造企业数字化底座的解决方案、和拥有丰富企业服务经验的'帮手'来拉一把。
正如我们上文所分析的,大语言模型的场景覆盖各行各业的诸多环节,这也让其应用和落地无法一概而论,整体体现为高度的非标准化,'边摸索、边创新、边落地'成为了当下的解决思路。埃森哲云服务团队结合自身对大语言模型、对企业业务的理解,将这种'边摸索、边创新、边落地'定义为六个步骤:
以积极的心态全身心拥抱变革,将业务需求和目标作为驱动力,迅速行动。企业不应为了技术而技术,而应明确 LLM 能解决什么具体的业务痛点,例如客服自动回复、文档摘要生成或代码辅助编写。只有明确了 ROI(投资回报率),项目才能持续获得资源支持。
在解决问题和开展工作时,将关注点放在人的需求和体验上,确保以人为中心的方法来处理事务。这包括改变员工的工作习惯,提供足够的培训,消除对 AI 替代工作的恐惧。建立人机协作的新流程,让 AI 成为员工的助手而非替代者。
整理和准备企业拥有的独特数据资源,为后续的生成式 AI 的使用和决策提供必要的数据支持。这是最关键也是最困难的一步。企业需要清洗历史数据,构建向量数据库,设计 RAG(检索增强生成)架构。数据的质量直接决定了模型输出的准确性。建议采用 ETL 流程,将非结构化数据转化为结构化知识库。
在技术方面进行投资,建立一个稳固可持续的基础设施,以支持长期的生成式 AI 的业务需求和创新。在互联网和移动互联网时代,虽然每家云供应商的整体技术架构有所不同,但是其技术原理和能力大多是相同的。而现如今的大语言模型能力,都能够通过神经网络实现知识的输入和输出,但是不同厂商大语言模型的最终结果有所差别,因此如何选定合适的生成式模型并以此为基础构建可持续的生成式 AI 技术能力,成为了一个关键课题。
这需要企业评估算力成本、API 调用延迟以及模型的可扩展性。通常建议采用混合云架构,敏感数据私有化部署,通用计算公有云弹性伸缩。
推动生态系统内的创新,加快不同组织、合作伙伴之间的创新合作,实现更快的发展和增长。企业不应闭门造车,应利用开源社区的力量,参与行业联盟,共享最佳实践。通过与云厂商、ISV(独立软件开发商)合作,快速集成成熟的 AI 组件。
进一步提升人工智能技术的水平,注重负责任的使用和开发,确保生成式 AI 的影响是积极和可控的。这涉及伦理审查、偏见检测、内容安全过滤等机制。企业必须建立 AI 治理委员会,制定使用规范,防止生成有害信息或侵犯知识产权。
另一个是潜藏在'准备企业的专有数据'环节背后的数据安全问题,AI 大语言模型在完成自然语言预训练的基础上,需要进一步结合应用场景的特定数据,才能够实现能力的特化。在企业应用视角中,就是需要大量的企业真实数据、知识,其中往往会存在涉及商业机密的内容。
现在有很多企业会直接禁止员工使用公开的大语言模型,就是担心他们在处理公司任务的过程中,将企业的数据泄露出去。如何确保在推广大语言模型的过程中,确保自身企业数据的安全,是一个必须解决的难题。
面对这些挑战,在 AI 新技术探索上足够前沿,同时又深入理解企业需求的云服务团队,就体现出了明显的优势。以大语言模型的选择为例,与全球范围内的主流云供应商都有着深度的合作,同时全球范围内数量众多、覆盖各行各业的客户也让其在技术应用环节上积累了丰富的经验。
在具体的大语言模型应用中,联合国内外各家云厂商携手推出了大语言模型 Sandbox(沙箱)平台。企业客户可以在大规模投入之前,在云上结合自己的业务场景进行试验,甚至是完成端到端的交付,快速验证,快速纠错。
在数据安全方面,做了两手准备:
任何服务和产品,一旦上升到企业级,就会变成最为严肃的问题。从创立之初就专注为企业提供技术和咨询等服务的专业机构,向来遵循这一准则。致力于帮助企业利用最新技术达成业务目标、变得更成功。
回到大语言模型上,最终价值是帮助客户有效地将这种新技术趋势用起来,从而赢下未来的竞争。
客观来看,目前国内哪怕最先开始尝试应用大语言模型的先锋企业,现在仍然还在比较前期、研究怎么将企业数据、经营流程与大语言模型技术进行契合的阶段。针对大语言模型技术在具体业务场景中的应用范式,国内的很多云服务商和创业公司仍在持续技术创新的过程中。但先行起跑、在行业中抢先推行技术变革、做好数据收集和准备,必然能在将来大语言模型最终落地时,获得先手优势。
在这一场必然发生的技术变革中,同时具备'对于 AI 技术未来发展趋势深入理解'和'企业真实需求/思考第一视角'的专业力量,正在成为中国企业迈入 AI 新时代的最佳助力。企业应当从现在开始,逐步完善数据资产,培养 AI 人才,构建安全的 AI 基础设施,为未来的智能化转型打下坚实基础。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online