对 AI Agent 智能体在企业应用中落地的价值、场景、成熟度做了分析,并且探讨了未来企业 IT 基础设施与架构如何为未来 Gen AI(生成式 AI)做好准备。在这样的架构中,我们把最终体现上层应用能力的 AI Agent 从不同的技术要求与原理上分成了几类:
- 创作与生成类助手
- 企业知识助手
- 数据分析助手
- 应用/工具助手
- Web 操作助手
- 自定义流程助手
本篇将对这几类 AI 助手分别做进一步探讨。
一、创作与生成类助手
大模型是生成式 AI 的基础,因此,理解、创作与生成内容是其强项也是最基本的能力。在 C 端市场,大量的生成类 AI 工具已经遍地开花(包括图片、视频、音乐),也是目前最成熟的一种应用形式。需要注意的是,在 C 端工具中,我们也经常看到各种形式的简单'助手':
这里的助手与我们这里探讨的企业应用中的 AI Agent 有一定的区别:
AI Agent 是一个以任务驱动的具备自主能力的智能体,不仅需要大模型这个核心'大脑',也需要任务规划、记忆与外部工具使用等能力。而我们常看到的个人 AI 助手大部分是基于预设提示词的大模型问答 Bot,在不借助其他插件时,通常不具备工具使用能力。
当前在企业应用中以内容创作生成为主要能力的 AI Agent 从技术上至少有两种:
1. 单 Agent 的内容生成
简单地将大模型的生成能力通过 API 集成到其他应用与业务流程中,替代或简化原来由人工完成的部分工作。比如:
- 在线培训管理系统中,利用 AI 自动根据课件创建考题/考卷
- 在数字营销流程中,利用 AI 生成精确营销话术甚至撰写营销方案
- 市场分析的 AI Agent 基于互联网搜索或开放数据生成市场分析报告
- 电子商务企业借助 AI 自动批量生成商品摘要
- 媒体行业通过 AI 生成新闻摘要;学术平台借助 AI 生成论文摘要
这种类型的 AI 助手简单的借助 Prompt 工程即可实现(与 C 端个人助手并无本质区别)。在实际开发中,通常采用如下逻辑:
# 伪代码示例:单 Agent 内容生成
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
llm = OpenAI(temperature=0.7)
prompt = PromptTemplate(
input_variables=["topic", "style"],
template="请写一篇关于{topic}的文章,风格要求{style}"
)
chain = prompt | llm
result = chain.invoke({"topic": "人工智能趋势", "style": "专业严谨"})
2. 基于多 Agent 协作的内容生成
典型的为虚拟机器人软件公司,由 AI Agent 担任多个软件开发岗位,通过相互协作完成某个软件开发任务。这种多 Agent 协作型的助手可以借助 Multi-Agents 框架来简化开发与实现。比如 MetaGPT,可以根据自然语言描述的开发任务,组建 Agent 团队(PM、架构师、程序员、QA 等),遵循 SOP 并最终输出完整软件开发的成果(文档、代码、API 说明等)。
其他支持多 Agent 的开源框架包括微软的 AutoGen、xAgents 等。这些框架允许开发者定义 Agent 的角色、能力和交互协议,从而实现复杂的协同工作流。
二、企业知识助手
当前较为成熟的一种 Agent 类型。通俗地说,就是在企业应用中,通过'外挂'私有知识库来扩充大模型的知识储备,以提供基于自然语言的、对话式的企业私有知识访问(对应到 AI Agent 的基本能力之一:持久化记忆),以解决通用大模型在面向企业应用时领域知识不足导致的幻觉问题。


