企业里的 AI 落地正在转向 Agent。和单纯的聊天机器人不同,Agent 需要自主决策、调用工具、记住上下文,还得能规划和反思。招聘市场对这个方向的需求涨得很快,但很多招聘 JD 上写的技能要求让人摸不着头脑——LangChain、RAG、RLHF,到底要学到什么程度?
Agent 工程师在做什么
抽象点说,就是设计一个能干活儿的 AI。具体到工作上,大致分三块。
架构:让 AI 有记忆和协作能力
别让 Agent 每次对话都从头开始。RAG(检索增强生成)和知识图谱是给 AI 加'记忆'的主流方法。框架上,LangChain 用的人最多,AutoGen 适合多代理协作,LlamaIndex 偏向数据接入。向量数据库(如 FAISS、Milvus)负责存 chunk 和快速召回,Neo4j 这类图数据库则用来处理复杂关系。
推理:让 AI 思考更可靠
GPT 直接回答复杂问题经常翻车,所以有了思维链(CoT)、ReAct 这些 prompt 技巧,逼模型一步步来。更进一步,可以用 RLHF 针对业务场景微调回答偏好,或者 LoRA/QLoRA 低成本微调模型本身。推理加速(ONNX、TensorRT)则是工程落地时必须考虑的——不然响应太慢用户早关了。
工程落地:不只是调接口
搭一个 demo 和上线是两码事。API 设计上,gRPC 或 RESTful 怎么选,要不要加消息队列;部署上,容器化之后还得考虑弹性伸缩;线上得做 A/B 测试验证 Agent 改了什么 prompt 的效果。性能调优也少不了,比如 embedding 缓存、流式返回策略。
学哪些技能能干活
如果让我推荐学习顺序,大概是:
- 先精通 Python(Go 看团队技术栈),LLM 的基本原理得懂。
- 然后用 LangChain 或 AutoGen 搭一个最简单的 Agent——比如一个根据问题查文档然后回答的 bot,跑起来再说。
- 接下来啃 RAG 和向量数据库,理解文档解析、切片策略、嵌入模型选择这些实际会踩坑的地方。
- 再往后,接触推理优化。手头有业务数据的话,试试 LoRA 微调,感受一下 fine-tune 和 prompt 的差异。
- 最后,把 Agent 当成一个服务来做:写接口、配监控、做压测,让它能扛得住流量。
工具链大概会接触到这些:
- 框架:LangChain, AutoGen, LlamaIndex
- 检索引擎:FAISS, Milvus, Neo4j
- 微调与加速:LoRA, QLoRA, ONNX, TensorRT
- 服务与部署:Kubernetes, gRPC, RESTful
三个可以上手练的项目
看资料容易眼高手低,推荐几个开源项目,直接跑起来改。
LangChain + RAG 企业知识库 用 LangChain 搭配 FAISS,做一个能检索内部文档的问答系统。支持 PDF、Markdown 等格式解析,前端接 OpenAI API。跑通后你会对 RAG 的'索引-检索-生成'链路有体感。
适合想入门 RAG 的,或者公司内部想搭个知识库试试水的。
AutoGen 多智能体协作 AutoGen 是微软出的一个多代理框架,让多个 AI 角色分工协作,拆解任务再汇总。拿它来做代码生成或简单工作流自动化很直观。关键是理解各 agent 的提示词设计和控制流。
适合对多代理和任务拆解感兴趣的。
AI 编程助手 复刻一个类似 Copilot 的代码补全工具,基于 GPT 的 API,加上上下文提取。除了练手 prompt 工程,还能了解这类产品的限制——比如 token 长度、补全延迟这些实际痛点。
适合想研究 AI+编程的开发者。
学习路线(建议节奏)
头三个月:Python 写熟,LLM 基础弄懂,LangChain 搭个原型; 接下来的半年:扎进 RAG、向量数据库,顺便了解知识图谱能解决什么问题; 半年之后:开始碰微调(LoRA),做完整系统,压测优化,结合业务场景去迭代。
Agent 方向技术更新快,但底层能力是相通的——检索、推理、工程部署。如果对'让 AI 成为能干活的同事'这件事有兴趣,现在入场不算晚,也从不需要等到'准备好'。


