跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言SaaSAI算法

后端开发者 AI Agent 入门:Astron 概念、架构与部署

综述由AI生成面向后端开发者介绍 AI Agent 的核心概念及 Astron 智能体平台。首先区分了 LLM 与 Agent 的差异,阐述 Agent 的定义、能力及原理(记忆、规划、工具、行动)。接着详解 Astron 平台的七大核心组件与架构设计,包括模型底座、企业级核心能力、开发管控及开放生态。最后介绍了 Astron 的服务架构微服务组成及容器化部署方案,旨在帮助开发者构建高可用企业级商用 AI Agent。

Qiny01发布于 2026/3/21更新于 2026/5/2020 浏览
后端开发者 AI Agent 入门:Astron 概念、架构与部署

1、先搞清楚一个问题:什么是 Agent?

在开始讲 Astron Agent 智能体之前,我们先统一一个认知。

  • LLM(大语言模型) 更像一个'聪明的问答系统',负责思考和回答问题
  • Agent(智能体) 不只是回答问题,而是可以: 拆解任务 调用工具 执行动作 记住上下文 不断优化结果

一句话区别:LLM 负责'想',Agent 负责'把事情做完'。

2、LLM 和 Agent

LLM 是接收输入、理解语义、生成内容、输出文本的被动响应式语言模型

Agent 是能够感知环境、理解指令、制定步骤并执行任务的智能体

我们熟悉并常常使用 LLM 大模型,但可能很少用到 Agent。

我们都知道 LLM 是大语言模型,市场上最好的大语言模型有 GPT(OpenAI)、Gemini(Google)、ChatGLM(智谱清言)、通义千问 (阿里巴巴)、讯飞星火 (科大讯飞) 等。

我们常打开网页版对话窗口,将大模型作为技术顾问,主动问一些问题,大模型在很短的思考时间后给出我们解决问题的建议。我们采纳这些建议就按照建议去处理问题,认为回答内容没有解决问题,可以继续追问大模型。

在这里插入图片描述

假设你下班后很累,想吃一顿外卖,但你不知道该怎么点、点什么。

(1)你去问 LLM(大语言模型)

LLM 的角色更像一个顾问,它只负责告诉你应该怎么做,真正的操作(打开 App、下单、支付)全部需要你自己完成

LLM 会思考、会回答,但不行动

你对 LLM 说:

'我想点一份外卖,不知道该怎么点、点什么。'

LLM 会回答你类似这样的话:

打开外卖 App 注册或登录账号搜索你想吃的菜品选择商家并下单支付并等待配送

(2)你去问 Agent(智能体)

Agent 不只是告诉你怎么做,而是直接帮你把事情做完。

Agent 会思考、会规划、还能调用工具并真正执行行动

你对 Agent 说:

'我想点一份外卖。'

Agent 会这样做:

理解你的目标:解决吃饭问题主动思考方案:是点外卖、做饭还是去附近吃调用工具:打开外卖平台执行步骤:搜索你常点的餐厅选择合适的套餐下单并支付完成任务:把外卖点好,并告诉你'已下单,预计 30 分钟送达'

3、Agent(智能体)核心概念

3.1 Agent 定义

Agent 是能够感知环境、理解指令、指定步骤、执行任务的自主"执行人",不依靠固定流程,能在不确定场景中,自主选择步骤,调整策略。

3.2 Agent 能力

具备感知环境、认知能力、行动、闭环的能力。

  • 感知环境 感知环境指 Agent 具备读取外部数据的能力 支持多模态输入,比如文本、文档、图片、音频、视频等数据可以作为 Agent 的外部输入,Agent 接收输入后,对输入内容进行意图识别并输出符合预期的结果。
  • 认知能力 指 Agent 能够理解用户的指令,分析用户的意图,并制定合适的目标,形成执行步骤
  • 行动 Agent 能够用接口、工具或直接生成内容来完成既定的执行步骤。观察结果再调整下一步
  • 闭环 Agent 能够形成自我闭环。 比如某个 API 调用失效,Agent 会切换策略,切换执行计划;某个采集的数据集是不齐全的,会再次从网络抓取;如果执行结果有问题,会尝试其他策略来达成计划目标。

4、Agent 原理

在这里插入图片描述

Agent 基本框架大概分为记忆、规划、工具、行动 4 个模块。

(1)记忆模块

短期记忆: 维持对话的连贯性,用于临时保存当前对话的上下文

长期记忆: 类似于知识库,用于存储智能体学到的经验,重要事实,用户偏好等持久化信息。 记忆模块使 Agent 能够拥有连续性和个性化

(2)规划

这是智能体思考的过程,面对复杂目标时,智能体会将目标分解为可执行的子任务序列。

反思与自我反思:这是 Agent 的关键,指智能体能够评估自身行动结果,修正错误,优化后续计划,实现持续改进。

(3)工具

智能体扩展工具,自身能力外的插件,可以调用这些工具,突破纯文本处理的瓶颈,与现实世界(比如获取实时信息、操作外部系统)进行交互

(4)行动

智能体执行步骤的执行环节。

智能体根据规划,综合运用记忆和工具,执行具体的操作(比如生成回答,调用 API,修改文件等)。

5、Astron Agent(星辰 Agent)是什么

在这里插入图片描述

讯飞星辰 Agent 平台是科大讯飞自研,面向国内的企业级 Agent 开发平台。Astron 是科大讯飞推出的一款开源共建智能体平台。

Astron Agent 平台搭建了一套从基础设置、模型底座开始,具备 AI 能力、RAG 知识库、RPA、记忆能力、测评工具、MCP、代码解释器等核心组件的智能体开发平台。并且能规模化管控,支持企业级高可用部署。

Astron 能帮助你不用从零写 AI 系统,就能搭建高可用、企业级的商用 AI Agent。

6、Astron Agent 核心组件与架构设计

在这里插入图片描述

从整体上看,Astron Agent 平台可以拆成 7 个层次:

  • 企业级云服务基础设施
  • 模型底座
  • 核心能力组件
  • 智能体开发
  • 智能体调优
  • 企业级开发与管控
  • 开放的生态平台
6.1 企业级云服务的基础设置

基础设置提供了算力、存储、网络、安全、稳定性等服务。

比如阿里云、华为云等公有云服务。我们可以把服务部署到这些云服务器,当然也可以本地部署。Astron 提供了 Docker Compose、Helm 两种部署方式,满足不同的场景需求。

6.2 Agent 的大脑 – 模型底座

支持本地部署的模型、支持 OpenAI Link API、支持讯飞星辰 Maas

这里 Astron 不限制单一模型,支持私有化模型,支持国内/海外模型灵活切换。企业或个人完全可以基于实际场景选择不同的大模型底座。

6.3 Agent 为什么能干活 – 企业级核心能力

Agent 不只能回答用户的问题(传统的聊天机器人),还能查资料、算数据、操作系统、执行流程。

核心能力包括插拔式知识库、AI 能力、RPA、记忆、MCP、测评工具、代码解释器。

6.4 Agent 的创建 – 智能体开发

支持多种交互形态,文本、图片、语音、虚拟人、实时语音通话

支持多种智能体形态,单智能体、多智能体、工作流驱动

这里的智能体形态可以理解为,1 个智能体单独干活,多个智能体组合干活,工作流驱动指的是可按照流程自动的执行任务。

6.5 Agent 的优化 – 智能体调优

实际场景中搭建的智能体,不会是一次搭建就能解决业务中的问题,往往会遇到各种现实问题,使得企业很难落地。

搭建智能体后,需要持续调优,具体措施包括 Prompt 开发、多维度评测、全链路观测、效果优化。

需要开发者看清 Agent 每一步在想什么、做什么,然后不断调优。

6.6 企业级开发与管控

Astron 提供的企业级开发管控能力是 Agent 从个人 Demo 到企业化生产力工具的关键。

Astron 提供了低代码开发、场景模板、组织架构、权限管控、授权管理、安全审核、监控运营、团队空间等能力,使得企业级开发管控得以实现。

6.7 Astron 开放生态 – 开放的生态平台

Astron 不是封闭的开发平台,允许对接讯飞开放平台 AI 能力、Astron RPA 平台、虚拟人平台、AIUI 超拟人交互平台、Zapier 等,来和外部进行交互。

Agent 可以真正进入企业系统、第三方工具和真实业务流程。

7、Astron 产品功能特性

7.1 产品功能特性
  • 多类型智能体开发 简易版 – 提示词驱动的智能体 进阶版 – 工作流驱动的智能体 专业版 – 集成 RPA、语音交互虚拟人智能体
  • 多类型模型接入 提供云 API 接入、本地部署、企业级私有化部署方案 满足企业私有化、高并发,高可用的业务场景
  • 全流程智能体优化 提供开发、调试、评测、优化全流程闭环能力。支持实时干预、变量追踪、多维性能分析
  • 企业级开发管控 支持灵活的权限管控,内置数据看板实时呈现关键指标,助理敏捷优化 Agent 构建策略
7.2 关键技术特性
  • 流式多模态引擎 支持多模态输入,包括文本、文档、图像、音频、视频 支持多模态输出,包括文本、文档、图像、音频、视频 使用了复杂流程编排引擎,上下文管理机制,丰富的能力节点来驱动工作流 Agent。
  • Astron RPA'最强双手' 支持 Windows 桌面软件与浏览器,实现跨应用,端到端的自动化。 内置 300+ 原子能力,支持图形化编排,自定义扩展 深度集成 Astron Agent。支持 RPA 与 AI 的双向调用。
  • 企业级评测能力 功规驱动的端到端效果评测体系 丰富的评测能力 Agent 全维度复刻人工评测

8、Astron 服务架构

在这里插入图片描述

Astron 采用微服务架构,由十个核心服务组成,每个服务专注于特定的业务领域,并通过容器化方式独立部署。

Astron 还集成了 Casdoor、Ragflow、RPA 开源框架来实现单点登录、知识增强检索、流程自动化能力。

8.1 外部集成服务
  • Casdoor Casdoor 是一个基于 OAuth 2.0 的开源的身份认证平台。Astron 基于 Casdoor 实现的单点登录。
  • Ragflow Ragflow 是一款开源的知识库平台,将 RAG 技术和 Workflow 深度融合,提供了一个精准可控的自动化的企业级知识管理解决方案。
  • RPA AstronRPA 是一款企业级机器人流程自动化桌面应用。通过可视化设计器支持低代码开发,快速构建工作流,实现桌面软件与浏览器页面自动化。 用户可以在 Astron Agent 中直接调用 RPA 流程节点,实现 RPA 与 Agent 的高效协同。
8.2 控制层后端层

用户认证和权限管理

模型管理和配置接口

文件上传下载服务

数据统计分析

core 服务接口

8.3 核心微服务层
  • Agent Service 智能体服务 Agent 核心执行引擎 Agent 生命周期管理 工具调用和插件集成 会话管理和上下文持久化
  • Workflow Service 工作流服务 工作流编排和执行引擎 多步骤流程自动化 工作流版本管理 事件驱动的异步处理 工作流可视化运行时调试
  • Knowledge Service 知识库服务 知识库管理 多种文档格式解析 RAG 支持星火知识库和 Ragflow
  • Memory DB Service 内存数据库服务 对话历史存储和检索 上下文管理,调用长期记忆和短期记忆 会话数据持久化
  • Tenant Service 租户服务 多租户管理 空间隔离与权限控制 组织结构管理 资源配额管理
  • Common Service 公共模块 提供公共服务和工具类 认证和审计服务 可观测性支持 基础设置组件数据库(MySQL、PGSQL)、缓存(Redis)、消息队列(kafka) 统一的日志系统 OSS(MinIO)对象存储集成
8.4 插件系统
  • AI Tools 集成讯飞 AI 工具,通过 iFLYTEK API 集成 第三方 AI 工具集成 工具调用管理和结果缓存
  • RPA RPA 流程自动化 流程录制和回放 自动化脚本执行 与外部 RPA 执行器集成
  • LINK 外部链接资源集成 URL 内容抓取处理 链接验证和元数据提取

9、Docker Desktop 容器化部署效果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

目录

  1. 1、先搞清楚一个问题:什么是 Agent?
  2. 2、LLM 和 Agent
  3. 3、Agent(智能体)核心概念
  4. 3.1 Agent 定义
  5. 3.2 Agent 能力
  6. 4、Agent 原理
  7. 5、Astron Agent(星辰 Agent)是什么
  8. 6、Astron Agent 核心组件与架构设计
  9. 6.1 企业级云服务的基础设置
  10. 6.2 Agent 的大脑 – 模型底座
  11. 6.3 Agent 为什么能干活 – 企业级核心能力
  12. 6.4 Agent 的创建 – 智能体开发
  13. 6.5 Agent 的优化 – 智能体调优
  14. 6.6 企业级开发与管控
  15. 6.7 Astron 开放生态 – 开放的生态平台
  16. 7、Astron 产品功能特性
  17. 7.1 产品功能特性
  18. 7.2 关键技术特性
  19. 8、Astron 服务架构
  20. 8.1 外部集成服务
  21. 8.2 控制层后端层
  22. 8.3 核心微服务层
  23. 8.4 插件系统
  24. 9、Docker Desktop 容器化部署效果
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Linux 基础 IO:深入理解软链接与硬链接
  • Neo4j 图数据库从搭建到项目使用深度详解
  • LeetCode 3637. 三段式数组 I 解法:一次循环遍历
  • C++ STL 栈与队列模拟实现及容器适配器原理
  • ForkJoinPool 基本使用及原理解读
  • 基于 LazyLLM 框架构建自动化财报分析 Agent
  • 如何快速部署 OpenAI Whisper:离线语音转文字指南
  • JavaScript 流程控制与数组基础实战
  • 基于协同过滤算法的 Flask 理财产品推荐系统
  • Spring AI Alibaba A2A 分布式智能体通信实战指南
  • Spring Boot 实战:基于 WebSocket 的前后端实时匹配系统实现
  • 利用腾讯云 HAI 与 DeepSeek 快速构建个人网页
  • Go 语言信用卡号码 Luhn 算法校验实现
  • 利用腾讯云 HAI 与 DeepSeek 快速构建个人主页
  • 字节跳动开源 Seed-OSS-36B:512K 上下文与推理控制
  • 大模型提示工程(Prompt Engineering)核心解读与实战指南
  • 数据结构基础:树与二叉树定义及遍历算法
  • Python 安全信息收集工具:域名查询与解析实战
  • MIT 室内场景识别数据集详解与 YOLOv8 实战
  • DeepSeek-R1 大模型基于 MS-Swift 框架的部署、推理与微调实践

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online