ToB 垂直领域大模型的探索与实践
背景
在数字化转型的浪潮中,垂直领域大模型(Vertical Domain Large Model)成为了解决特定行业痛点的关键技术。本文分享了物流技术团队在垂直领域大模型开发和部署过程中的技术细节、挑战解决策略以及实际应用案例。
在过去一年多的实践工作中,团队围绕'物流体验'这一垂直领域,尝试通过垂直领域大模型为物流咨询、商业化答疑、内部工单答疑等场景提供快捷、轻便的大模型能力。同时,在实践中打磨了专属平台,支持使用者快速自定义场景并创建专属于自己的物流小助手。在此分享相关经验,供同行交流探讨。
垂直领域大模型的特点与挑战
垂直领域大模型是指以通用大模型作为 Base Model,再喂以特定领域或行业的领域知识,经过训练和优化的大语言模型。与通用语言模型相比,垂直领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。
优势
- 领域专业性:经过专门训练,能够更好地理解和处理特定领域的知识、术语和上下文。
- 高质量输出:在特定领域中进行了优化,输出质量通常比通用大模型更高。
- 特定任务效果更好:对于特定领域的任务,表现通常优于通用模型。
To B 场景的挑战
尽管优势明显,但 B 端场景的特殊性带来了独特的挑战:
- 准确性要求高:C 端场景下消费者对结果容忍度较高,但 B 端商家对准确性极度敏感。一次错误可能导致信任丧失,试错成本极高。
- 知识库维护频繁:B 端业务规则变化快,知识库素材多样(流程图、PPT、PDF 等)。如何高效识别不同体系的知识并召回高质量答案是关键。
- 适用性限制:垂类模型在其他领域表现较弱,但实际使用中用户常问非垂直问题。微调时需合并通用数据集以保持基础能力。
技术架构与核心方案
针对上述挑战,我们构建了包含对齐增强、Text2API、RAG 及 SFT 的综合技术框架。
1. 对齐增强(Alignment Enhancement)
在实际答疑场景中,用户提问往往描述简略。借鉴 Black-Box Prompt Optimization (BPO) 思路,通过优化提问和提供思路提升模型理解力。
实施步骤:
- 生成负样本:给定初始指令,让模型 A 针对标准问答对生成答案,形成三元组(Q, Good Answer, Bad Answer)。
- 指令优化:利用 GPT-4 对比好坏答案,优化初始指令生成 Tuned Instruction。
- 训练预测模型:训练 Seq2Seq 模型,输入问题 Q,输出 Tuned Instruction。
- 推理集成:将 Seq2Seq 模型嵌入推理链路,所有用户问题先经其生成提示词,再送入主模型。
该方法使回答准确率提升了约 1.8%。例如,原问题'天猫超市供应商如何入驻?'经优化后变为详细的流程指引指令,显著提升了回答的结构性和深度。
2. Text2API 工具调用
大模型作为 Agent 使用工具是区别于传统机器人的特点。物流场景下有超过 1000 个高频 API,且部分 API 相似度高。要求查询时间压缩在 2 秒以内,需高效准确识别参数并匹配 API。
演进过程:
- LangChain React 框架:初期使用,但在中文模型上参数识别差,易产生幻觉;调用链路过长,缺乏惩罚机制导致错误难以自动修正。
- Reflexion 框架:引入自我反思机制,保存短期和长期记忆。基于储存的记忆诱导模型生成更好答案,API 准确率提升 4%。同时结合对齐增强模块补充 API 描述,解决相似 API 识别问题。
3. RAG(检索增强生成)优化
RAG 是经典应用方案,但在 ToB 场景面临复杂素材解析难题。文档可能包含合同 PDF、表格、截图及流程图。
复杂素材处理:


