大模型智能应用开发:大公司的策略与经验
从 BERT、GPT、T5 等通用大模型展示了令人瞩目的语言理解和 NLP 任务解决能力,到 ChatGPT 惊艳发布,再到国产大模型的百花齐放,我们目睹了大模型通过海量参数和强大的学习能力,不仅在问答、对话、摘要、翻译等任务上取得了不错的成果,更是推动了人工智能的边界不断扩展。
而在百模大战之后,国内也迅速进入应用爆发的阶段,无论是创建逼真的聊天机器人、GPTs,还是垂直行业的大模型工程实践,这些应用都展示了大模型在实际场景中的巨大潜力。
在 2024 全球软件研发技术大会(SDCon)上,特设的'大模型智能应用开发'论坛邀请了来自腾讯、去哪儿、京东、美图、eBay、衍数科技、宾夕法尼亚州立大学的一线技术专家和行业领袖,深度探讨智能应用最新的研究成果和开发经验。
腾讯:智能数据研发技术分享
大模型改变很多公司的研发范式,其中也包含了腾讯。
腾讯大数据 AI 算法负责人黎洋在发表《智能数据研发技术分享》演讲时表示,传统的数据研发全过程涉及了数据接入、元数据采集与治理、数据地图、数据分析、可视化和洞察等多个环节,形成了一个漫长而复杂的链路。每个环节都需要数据工程师和分析师的人工干预,导致研发成本居高不下。
如今,拥有强大的语言理解、推理、生成和知识能力,甚至涌现出类似人类的能力的大模型技术,为我们带来了新的机遇。黎洋指出,特别是 AI Agent 技术的发展,使得以自然语言交互方式高度自动化执行复杂任务成为可能。
基于这些维度,黎洋分享道,倘若把大模型技术带入数据研发全流程中,借助它的知识推理、知识压缩、信息理解等能力无疑可以有效解决传统数据研发中需求排期慢、开发效率低、取数流程长以及治理效果差等问题。
进而,也可以基于大模型相关的技术为处理数据研发的整个流程打造一个 AI 智能体,即大数据智能体,可以用它来接收用户的自然意图(文字,截图,语音等)作为输入、以大语言模型作为规划中枢大脑、整合现有大数据平台的数据知识与数据服务工具。同时,在数据工程、数据科学、数据分析环节提供自动化的智能决策和智能分析服务。
在演讲中,黎洋表示,智能数据研发也没有想象中那么简单,至少需要'过三关':
**第一,在数据接入和数据地图环节的'找数'问题。**对于许多数据开发工程师来说,这个过程非常困难,因为他们可能不了解底层数据存储的详细信息。因此,当需要获取上层应用的数据时,他们往往不知道应该查找哪些数据库、哪些表以及哪些字段。此外,元数据质量参差不齐、知识整理标准不一、人力维护消耗、答案正确性评价难、指标加工的复杂 SQL 逻辑理解难度大都是难点。
**第二,在数据地图和数据分析的使用环节中的'用数'问题。**用户在用数据时,最大的难点之一就是口语化表达的不一致,导致大模型在理解这些名词时会出现偏差。其次,大模型对于深度业务知识理解、分析方言的兼容都有所不同。
**第三,在数据可视化和数据洞察环节的'懂数'问题。**包括类似于增长分析这样的业务的场景,它的难点在于它是完全业务导向的一个深度的分析,同时需求多变、需要定制化建设。
基于这些机遇与挑战,腾讯大数据团队在智能化方向进行了一系列能力建设,包括沉淀领域原子能力、理解业务私域知识、优化领域模型、集成专用工具等等。在此基础上,黎洋分享道,腾讯开发了三大智能体系统应用:**Chat Data、Chat BI 和数据洞察。**Chat Data 作为智能找数助手,实现了数据资产智能查找和 SQL 生成等功能,有效解决了海量数据和复杂字段指标带来的挑战;Chat BI 则通过对话式分析大幅降低了数据分析门槛,支持多轮对话、意图识别和问题联想等功能;数据洞察系统更是实现了从简单趋势分析到深度业务洞察的能力演进,能够支持增长分析等复杂分析任务。
在技术实现上,腾讯大数据团队综合运用了领域知识库建设、意图识别与优化、任务规划、工具调用、RAG 技术应用、数据增强与自动标注、模型微调和后处理策略等多项关键技术。黎洋表示,借助 AI Agent 加速研发只是一个起点,未来其也将在更多方面持续推进相关能力的建设,进一步提升大数据智能化的应用水平。
去哪儿旅行机票主流程 AIGC 探索实践
在本次论坛上,去哪儿旅行技术总监李佳奇坦言,带领一个业务研发团队,推进 AIGC 项目落地和探索也面临层层压力:一是公司高层对这一颠覆性技术的关注和焦虑,他们关心在 AIGC 时代如何保持技术团队的竞争力;二是团队的迷茫,担忧技术储备是否足够以及是否会被 AI 取代;三是市场用户对创新应用的期盼,期待着杀手级应用的问世。
李佳奇认为压力往往是推动进步的动力。为此,去哪儿业务研发团队给出了三个应对策略,如开发 Langchain4J Qunar 框架、RAG/LlamaIndex4J 框架来打基建,结合既有的业务去找机会点,以及增强团队成员的 AIGC 技术储备,实现团队的整体升级。
针对初接触 AIGC 的团队该如何寻找落地点的问题,李佳奇分享了三个步骤:
**标记阶段。**尝试 AI 业务矩阵法,基于文本生成、图像生成、视频生成、逻辑推理分析等 AI 能力,探索搜索、预定、交易、出行、售后、用户体验和营销等业务场景的应用可能性,结合技术可行性和成本确认机会点。
**探索阶段。**这一阶段需要研发团队事先准备数据和测试集,因为数据质量直接决定项目最终的落地效果。再通过人工与代码结合的 Demo 验证结果,并提交给产品团队和业务团队进行确认,确保效果符合预期。
**落地阶段。**推出 MVP 版本并上线。内部上线验证和流程控制后,锁定技术资源进行封闭开发。整个过程通常周期较长(大约几个月),并进行自动化测试和小流量验证。
基于此,去哪儿在 AIGC 方面做了一些探索实践,其中之一是机票主流程的探索。李佳奇表示,这里的核心逻辑是:大模型在机票业务中被赋予业务专家、营销专家、售前导购、用户本身等角色,让大模型实时观察用户操作行为和看到的结果,通过大模型强大并且不断提升的思考、推理能力,来挖掘目前机票主流程在用户体验、产品力、营销等提升潜力并给出方案,再结合 Agent 的执行能力来执行有效动作。


