AI Agent(智能体)在企业应用中落地的价值、场景及成熟度已得到广泛分析,同时探讨了未来企业 IT 基础设施与架构如何为生成式 AI(Gen AI)做好准备。在此架构中,将体现上层应用能力的 AI Agent 从技术要求与原理上分为以下六类:
- 创作与生成类助手
- 企业知识助手
- 数据分析助手
- 应用/工具助手
- Web 操作助手
- 自定义流程助手
1. 创作与生成类助手
大模型是生成式 AI 的基础,理解、创作与生成内容是其强项也是最基本的能力。在 C 端市场,大量的生成类 AI 工具已经普及(包括图片、视频、音乐),是目前最成熟的一种应用形式。需要注意的是,C 端工具中常出现的简单'助手'与企业应用中的 AI Agent 存在区别。
AI Agent 是一个以任务驱动的具备自主能力的智能体,不仅需要大模型这个核心'大脑',还需要任务规划、记忆与外部工具使用等能力。而常见的个人 AI 助手大部分是基于预设提示词的大模型问答 Bot,在不借助其他插件时,通常不具备工具使用能力。
当前在企业应用中以内容创作生成为主要能力的 AI Agent 从技术上至少有两种实现方式:
- 单 Agent 的内容生成:简单地将大模型的生成能力通过 API 集成到其他应用与业务流程中,替代或简化原来由人工完成的部分工作。例如:
- 在线培训管理系统中,利用 AI 自动根据课件创建考题/考卷;
- 在数字营销流程中,利用 AI 生成精确营销话术甚至撰写营销方案;
- 市场分析的 AI Agent 基于互联网搜索或开放数据生成市场分析报告;
- 电子商务企业借助 AI 自动批量生成商品摘要;
- 媒体行业通过 AI 生成新闻摘要;学术平台借助 AI 生成论文摘要。
这种类型的 AI 助手简单的借助 Prompt 工程即可实现(与 C 端个人助手并无本质区别)。
- 基于多 Agent 协作(可能还有人类)的内容生成:典型的如虚拟机器人软件公司,由 AI Agent 担任多个软件开发岗位,通过相互协作完成某个软件开发任务。
这种多 Agent 协作型的助手可以借助 Multi-Agents 框架来简化开发与实现。比如 MetaGPT,可以根据自然语言描述的开发任务,组建 Agent 团队(PM、架构师、程序员、QA 等),遵循 SOP 并最终输出完整软件开发的成果(文档、代码、API 说明等)。
其他支持多 Agent 的开源框架包括微软的 AutoGen、xAgents 等。
2. 企业知识助手
当前较为成熟的一种 Agent 类型。通俗地说,就是在企业应用中,通过'外挂'私有知识库来扩充大模型的知识储备,以提供基于自然语言的、对话式的企业私有知识访问(对应到 AI Agent 的基本能力之一:持久化记忆),以解决通用大模型在面向企业应用时领域知识不足导致的幻觉问题。
知识助手通常借助于大模型的 RAG(检索增强生成)方案来实现,其本质上也是一种提示工程:**借助于在大模型输入时携带相关的私有知识上下文,让大模型理解、总结、整理并回答用户问题。**只是这里的私有知识上下文需要借助嵌入模型(Embedding Model)、向量数据库(Vector Store)、文档加载分割(Document Loader&Splitter)等相关技术来获得。
知识助手的技术实现基础架构如下:

基于 RAG 方案的 AI 助手实现可以自行通过代码直接实现,当然,为了简化开发与管理过程,推荐使用的工具包括:
- LangChain 或者 LlamaIndex 大模型主流应用开发基础框架:这两个基础框架对大量的模型、文档加载器、向量数据库、嵌入模型等做了抽象封装,并对 RAG 应用过程中的知识检索、Prompt 组装等过程做了简化,可以大大简化开发过程。
- 另一类是具备一定开箱即用能力的 RAG 应用构建平台:相对基础开发框架来说,提供了更完善的 RAG 应用构建工具,比如私有知识库的管理维护、测试、对话流程编排、提示词自定义等能力。这里推荐两个项目,一个是基于 Langchain 构建的 Langchain-Chatchat;另一个是 FastGPT,后者有用于商业运营的 SaaS 应用,可以自行体验。






