打造你的专属 AI 旅行管家:基于 OpenAgents 的多智能体旅游助手实战

打造你的专属 AI 旅行管家:基于 OpenAgents 的多智能体旅游助手实战

基于 OpenAgents 的多智能体旅游助手实战

在大模型与智能体(Agent)技术快速发展的今天,构建一个能理解需求、协调任务、调用工具的 AI 助手已不再是遥不可及的梦想。传统的聊天机器人往往只能被动回答问题,而现代智能体系统则具备“主动性”——它能拆解复杂目标、调用多个子模块、甚至与外部服务交互,从而完成端到端的任务。本文将带你从零开始,利用 OpenAgents 这一开源框架,搭建一个由多个专业智能体协同工作的本地旅游小助手。这个系统不仅能根据用户一句话生成完整的旅行计划、推荐个性化景点,还能逐步扩展至查询实时天气、预订酒店、规划交通等实用功能,真正实现“一句话开启智能旅行”。


一、本地启动智能体

要运行基于 OpenAgents 的智能体系统,首先需要启动其核心网络服务。该服务负责管理所有 Agent 的注册、通信和协作,是整个多智能体生态的“中枢神经系统”。

在终端中执行以下命令:

openagents network start 

首次运行时,OpenAgents 会自动打开浏览器,引导你完成初始化配置(如设置管理员密码、选择模型类型等)。配置完成后,服务将在后台持续运行,并监听默认端口。

✅ 启动成功的界面如下所示:

启动成功

接下来,我们需要启动具体的智能体实例。以 von.yaml 为例,这是一个基于智谱 GLM-4.7 模型的中文助手配置文件。由于 OpenAgents 兼容 OpenAI 协议,我们只需将智谱的 API 地址和密钥通过环境变量传入即可。

PowerShell 中执行以下命令(请务必将 "你的API-Key" 替换为你在 智谱 AI 开放平台 申请的实际密钥):

$env:PYTHONUTF8 = "1"$env:PYTHONIOENCODING = "utf-8"$env:OPENAI_BASE_URL = "https://open.bigmodel.cn/api/paas/v4"$env:OPENAI_API_KEY = "你的API-Key" openagents agent start agents/von.yaml 
💡 关键提示:YAML 配置文件中请勿包含任何中文字符(包括注释),即使文件保存为 UTF-8 编码,也可能因底层解析器兼容性问题导致启动失败。建议全程使用英文编写配置。

若终端输出类似 Agent 'von' is running on http://localhost:8080 的信息,且无报错,则说明智能体已成功加载并接入网络:

智能体启动成功

此时,该智能体已准备好接收来自 Web 控制台或其他 Agent 的消息请求。


二、通过 Web 平台进行测试

OpenAgents 提供了一个内置的 Web Studio 界面,用于可视化管理智能体、发送测试消息并查看响应。服务启动后,默认会跳转至控制台页面(通常为 http://localhost:8700/studio/):

Web 控制台首页

点击的 “管理员登录” 按钮:

管理员登录入口

输入你在首次配置 OpenAgents 网络服务时设置的管理员密码:

输入管理员密码

登录成功后,进入用户控制台主界面。这里会列出当前在线的所有智能体,并提供聊天窗口用于交互:

用户控制台

现在,你可以向 von 智能体发送一条中文消息,例如:“你好,你能帮我做什么?” 如果一切配置正确,它将返回一段符合预设行为规范的友好回复:

智能体成功响应

这标志着从模型调用、网络通信到前端交互的完整链路已打通。

🔗 若你在配置过程中遇到问题,可参考前置文章:《使用 OpenAgents 搭建基于智谱 GLM 的本地智能体(Agent)》,其中详细讲解了环境变量设置、YAML 结构及常见错误排查方法。

三、开发多 Agent 旅游小助手

单个智能体虽能完成简单问答,但面对“规划一次三天两晚的杭州旅行”这类复杂任务时,往往力不从心。为此,我们采用 多智能体协作架构(Multi-Agent Collaboration) ——将大任务拆解为多个子任务,由不同专业 Agent 分工处理,再由主控 Agent 整合结果。这种设计不仅提升系统鲁棒性,也便于后续功能扩展。

1. 行程规划智能体

该 Agent 专注于时间管理与日程安排。当接收到“帮我安排三天行程”类指令时,它会根据目的地、天数、用户偏好(如“喜欢自然风光”或“想体验夜市”)生成结构化的每日计划,包括时间段、活动内容和建议停留时长。

行程规划 - 输入


行程规划 - 输出
实现方式:通过在 YAML 的 instruction 字段中明确角色职责和输出格式,引导模型生成结构化文本。

2. 景点推荐智能体

此 Agent 拥有丰富的旅游知识库,能结合地理位置、季节、人群热度等因素,推荐匹配度高的景点。例如,用户说“我想去人少但风景好的地方”,它会优先推荐西湖周边的冷门古村落而非断桥。

景点推荐 - 输入


景点推荐 - 输出
优势:通过专用 Agent 隔离领域知识,避免主控逻辑臃肿,同时便于单独优化推荐算法。

3. 天气查询智能体

理想情况下,该 Agent 应能调用天气 API(如和风天气、OpenWeather)获取未来几天的预报。然而,当前 OpenAgents 的 YAML 模式仅支持纯语言模型推理,无法直接发起 HTTP 请求或执行代码

因此,在 YAML 配置下尝试天气查询会失败或返回模拟数据:

天气查询尝试(受限)
解决方案:OpenAgents 支持通过 Python 编写自定义 Agent 类。你可创建一个继承 BaseAgent 的模块,在 react() 方法中集成 requests 调用天气接口,并将结果注入对话上下文。这种方式虽需少量编码,但能解锁真正的“工具调用(Tool Calling)”能力。

4. 主控小助手智能体

作为用户唯一交互入口,主控 Agent 扮演“指挥官”角色。它负责:

  • 理解用户意图(如识别“规划旅行”是一个复合任务)
  • 拆解子任务(“需要行程 + 景点 + 天气”)
  • 依次调用对应专业 Agent
  • 整合各子结果,生成连贯、自然的最终回复

例如,当用户输入:“帮我规划一个三天两晚的杭州旅行,包括景点和天气”,主控 Agent 会内部协调其他三个模块,并返回一份整合报告:

主助手 - 用户提问


主助手 - 协同响应
🌟 这正是多智能体系统的魅力所在:每个 Agent 保持简单专注,整体却能完成复杂任务。

通过本次实践,我们不仅验证了 OpenAgents 在本地部署和多智能体协作方面的强大能力,也为构建更复杂的 AI 应用打下了坚实基础。未来,只需为每个智能体赋予更丰富的工具(如数据库查询、邮件发送、支付接口)和长期记忆(通过向量数据库或工作区机制),这个“旅游小助手”就能进化为真正的个人生活助理——不仅能安排行程,还能自动预订机票、提醒签证到期、甚至根据预算动态调整方案。

AI 的终极目标不是取代人类,而是成为我们最得力的协作者。而这一切,就从一行命令、一个 YAML 文件、一次本地部署开始。现在,轮到你来创造属于自己的智能体世界了。

Read more

万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!

万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!

在AI领域,大模型的发展正以前所未有的速度推进技术的边界。 北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。 纵观Llama系列模型,从版本1到3,展示了大规模预训练语言模型的演进及其在实际应用中的显著潜力。这些模型不仅在技术上不断刷新纪录,更在商业和学术界产生了深远的影响。因此,对Llama模型不同版本之间的系统对比,不仅可以揭示技术进步的具体细节,也能帮助我们理解这些高级模型如何解决现实世界的复杂问题。 1、Llama进化史 本节将对每个版本的Llama模型进行简要介绍,包括它们发布的时间和主要特点。 1.1 Llama-1 系列 Llama-1 [1]是Meta在2023年2月发布的大语言模型,是当时性能非常出色的开源模型之一,有7B、13B、30B和65B四个参数量版本。Llama-1各个参数量版本都在超过1T token的语料上进行了预训训练,其中,最大的65B参数的模型在2,048张A100 80

Llama Factory

1. Llama Factory 到底是什么? 1.1 简单比喻 想象你要定制一辆汽车: 传统方式(没有 Llama Factory): * 你需要自己造发动机、设计车身、组装零件 * 需要懂机械工程、电子技术、材料科学 * 整个过程复杂、容易出错、耗时很长 使用 Llama Factory: * 你只需要: 1. 选择基础车型(预训练模型) 2. 告诉工厂你的需求(训练数据) 3. 选择改装方案(训练方法) 4. 工厂自动完成所有改装 * 你不需要懂技术细节,只需要提需求 1.2 一句话定义 Llama Factory 是一个"AI模型定制工厂",它让普通人也能轻松地定制和训练自己的大语言模型。 2. 为什么需要

【AIGC】冷启动数据与多阶段训练在 DeepSeek 中的作用

【AIGC】冷启动数据与多阶段训练在 DeepSeek 中的作用

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |ChatGPT 文章目录 * 💯前言 * 💯冷启动数据的作用 * 冷启动数据设计 * 💯多阶段训练的作用 * 阶段 1:冷启动微调 * 阶段 2:推理导向强化学习(RL) * 阶段 3:拒绝采样与监督微调(SFT) * 阶段 4:多场景强化学习 * 💯代码示例:冷启动数据与多阶段训练的实现 * 1. 冷启动微调阶段 * 作用与应用: * 2. 推理导向的强化学习阶段 * 作用与应用: * 3. 拒绝采样与监督微调阶段 * 作用与应用: * 4. 多场景强化学习 * 作用与应用: * 总体流程 * DeepSeek 中的应用 * 💯总结 💯前言 在人工智能领域,深度学习模型的训练和优化往往需要大量的标注数据和计算资源。然而,面对复杂任务时,即使是最先进的技术和大量的训练数据也未必能够保证模型的最优表现。DeepSeek

GPU PRO 4 - 5.1 An Aspect-Based Engine Architecture 笔记

本笔记仅为个人的理解,如果有误欢迎指出 An Aspect-Based Engine Architecture 一种基于方面的引擎架构         不是很明白为什么GPU的书籍会有游戏引擎架构的文章。         这里Aspect在文章中的意义更像是表述一个功能模块,在Java中有将Aspect翻译成切面,但是Java切面主要是横向的代码注入,与本文的概念不相符。 大多数系统架构都会考虑将各个功能封装成模块或者组件,在面向对象编程的思想下,这个封装是基于对象去实现的,本文则描述了一种在引擎层面的封装功能的架构思想,封装后的产物被称为Aspect,每一个Aspect负责提供一些功能子集,并通过一个通用的接口与引擎核心通信。 引擎核心:         引擎核心的功能是保存游戏或者仿真时的数据结构以及相关状态,功能Aspect将会与这些数据进行交互。一般来说引擎核心会定义一些接口,外部的Aspect则通过接口访问当前的游戏数据                  用MVC架构的角度去理解的话引擎核心相当于M层,而各个Aspect则相当于C层。