基于 Java 从零实现 ReAct 模式 AI Agent | 极客日志

JavaAIjava算法

基于 Java 从零实现 ReAct 模式 AI Agent

综述由AI生成使用纯 Java 代码从零构建基于 ReAct 模式的 AI Agent，无需依赖 LangChain 等框架。ReAct 模式通过交替进行推理与行动，使 LLM 具备自主规划任务和调用工具的能力。文章涵盖系统架构设计、工具注解系统、Prompt 模板工程、核心循环逻辑及输出解析器实现。通过文件写入示例演示了思考 - 行动 - 观察的闭环流程。此外还提供工程化改进建议，包括循环计数修复、未知工具处理及自动工具注册，并探讨了多轮对话记忆、并行工具调用等进阶扩展方向，为深入理解 AI Agent 原理及后续工程落地提供实践参考。

Stephaine Walsh发布于 2026/2/6更新于 2026/5/2720 浏览

引言

在大语言模型（LLM）蓬勃发展的今天，AI Agent 已经成为最热门的技术方向之一。与传统的问答式 AI 不同，Agent 能够自主思考、规划任务、调用工具，并最终解决复杂问题。这种能力的核心在于让 AI 具备了"行动力"——它不再只是被动回答问题，而是能够主动采取行动来完成任务。

想象一下这样的场景：你对 AI 说"帮我把 1 到 10 的整数写入一个文件"，传统的 ChatGPT 只能告诉你"你可以使用 Python 的文件操作来实现…'，而一个真正的 AI Agent 会直接帮你创建文件、写入内容，然后告诉你"已完成，文件在 numbers.txt"。这就是 Agent 与传统 LLM 的本质区别。

在众多 Agent 架构中，ReAct（Reasoning + Acting） 模式因其简洁优雅而备受青睐。其核心思想是让 LLM 交替进行推理（Reasoning）和行动（Acting），通过"思考 - 行动 - 观察"的循环来解决问题。

接下来让我们从零开始，使用纯 Java 代码手写一个完整的 ReAct Agent。我们不依赖 LangChain、Spring AI 等框架，而是直接使用 OpenAI 官方 Java SDK 与大模型交互，深入理解 Agent 的工作原理。

一、什么是 ReAct 模式？

1.1 ReAct 的起源与核心思想

ReAct 由 Yao 等人在 2022 年提出（ICLR 2023 发表），论文标题为《ReAct: Synergizing Reasoning and Acting in Language Models》。其核心洞察是：将推理（Reasoning）和行动（Acting）交织在一起，可显著提升 LLM 解决复杂任务的能力。

传统的 Chain-of-Thought（CoT）只关注推理，让模型"一步步思考"来提升推理能力；传统的 Action-based 方法只关注行动，让模型直接调用工具。ReAct 的创新在于将两者合一：

Thought → Action → Observation → Thought → Action → Observation → ... → FinalAnswer

这种设计模拟了人类解决问题的认知过程：我们不会一次性想清楚所有步骤，而是边思考边行动，根据行动的反馈调整下一步计划。

1.2 ReAct 与思维链（CoT）的对比

思维链（Chain of Thought, CoT）技术，ReAct 可以看作是 CoT 的增强版：

特性	CoT（思维链）	ReAct
推理能力	✅ 支持	✅ 支持
外部工具调用	❌ 不支持	✅ 支持
信息获取	仅依赖模型已有知识	可从外部获取实时信息
任务执行	只能给出建议	可以实际执行任务
自我修正	较弱	较强（基于观察结果调整）

CoT 的局限在于，模型只能基于训练数据中的知识进行推理，无法获取实时信息或执行实际操作。而 ReAct 通过引入工具调用机制，让模型具备了与外部世界交互的能力。

1.3 ReAct 的核心执行循环

ReAct Agent 的工作流程可以概括为一个迭代循环：

Reason（推理）：分析当前状态，思考下一步应该做什么
Action（行动）：决定调用哪个工具
Action Input（行动输入）：生成工具调用参数
Observation（观察）：系统执行工具并返回结果
重复上述过程，直到模型输出最终答案（Final Answer）

用流程图表示：

┌─────────────────────────────────────────────────────────────┐
│ ReAct 执行循环                                                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  用户问题 ──→ 构建 Prompt ──→ 调用 LLM                      │
│      ↑                                                        │
│      │                                                        │
│      ↓                                                        │
│  历史记录更新 解析 LLM 输出                                   │
│      │                                                        │
│      ↓                                                        │
│  ┌─────┴─────┐ 是 FinalAnswer?                               │
│  │           │                                               │
│  │ Observation ├── 是 ──→ 返回最终答案                       │
│  │           │                                               │
│  └─────┬─────┘ ↓ 否                                         │
│        │ 执行工具                                              │
│        │                                                       │
│        └──────────────┘                                        │
└─────────────────────────────────────────────────────────────┘

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online

Reason: 用户需要将 1 到 10 的整数写入文件，我需要使用 writeFile 工具来完成这个任务。我需要指定文件路径和要写入的内容。
Action: writeFile
ActionInput: {"file_path": "numbers.txt", "content": "1\n2\n3\n4\n5\n6\n7\n8\n9\n10"}

Observation: 写入成功

Reason: 文件已经成功写入，任务完成。
FinalAnswer: 我已经成功将 1 到 10 的所有整数写入了 numbers.txt 文件。

┌─────────────────────────────────────────────────────────────┐
│ ReAct Agent                                                 │
├─────────────────────────────────────────────────────────────┤
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────┐  │
│  │ Prompt      │  │ LLM API     │  │ Output Parser       │  │
│  │ Template    │  │ Client      │  │                     │  │
│  └─────────────┘  └─────────────┘  └─────────────────────┘  │
├─────────────────────────────────────────────────────────────┤
│  ┌─────────────────────────────────────────────────────────┐│
│  │ Tool System                                             ││
│  │  ┌──────────┐  ┌──────────┐  ┌──────────────────────┐  ││
│  │  │ @Tool    │  │@ToolParam│  │ ToolUtil             │  ││
│  │  │ Annotation│ │Annotation│  │ (Reflection-based)   │  ││
│  │  └──────────┘  └──────────┘  └──────────────────────┘  ││
│  └─────────────────────────────────────────────────────────┘│
├─────────────────────────────────────────────────────────────┤
│  ┌─────────────────────────────────────────────────────────┐│
│  │ Agent Tools                                             ││
│  │  ┌──────────┐  ┌──────────┐  ┌──────────┐              ││
│  │  │writeFile │  │readFile  │  │search    │ ...          ││
│  │  └──────────┘  └──────────┘  └──────────┘              ││
│  └─────────────────────────────────────────────────────────┘│
└─────────────────────────────────────────────────────────────┘

组件	职责	关键类
模型配置	管理 API Key、模型名称、服务地址	`ModelConfig`
工具注解	声明式定义工具元信息	`@Tool`, `@ToolParam`
工具集合	实现具体的工具逻辑	`AgentTools`
工具工具类	通过反射生成工具描述	`ToolUtil`
Agent 核心	实现 ReAct 循环逻辑	`ReActAgent`

<dependencies>
    <!-- OpenAI 官方 Java SDK -->
    <dependency>
        <groupId>com.openai</groupId>
        <artifactId>openai-java</artifactId>
        <version>0.32.0</version>
    </dependency>
    <!-- JSON 处理（工具实现中使用 Jackson，来自 SDK 传递依赖） -->
    <dependency>
        <groupId>com.alibaba.fastjson2</groupId>
        <artifactId>fastjson2</artifactId>
        <version>2.0.56</version>
    </dependency>
</dependencies>

public class ModelConfig {
    // 从环境变量获取 API Key，安全且便于管理
    public static final String API_KEY = System.getenv("DASHSCOPE_API_KEY");
    // 使用 DashScope 的 OpenAI 兼容接口
    public static final String BASE_URL = "https://dashscope.aliyuncs.com/compatible-mode/v1";
    // 使用通义千问 Max 模型
    public static final String LLM_NAME = "qwen-max";
}

@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
public @interface Tool {
    String description(); // 工具功能描述，供 LLM 理解工具用途
}

@Target(ElementType.PARAMETER)
@Retention(RetentionPolicy.RUNTIME)
public @interface ToolParam {
    String description(); // 参数描述，帮助 LLM 理解如何构造输入
}

public class ToolUtil {
    public static String getToolDescription(Class<?> clazz) {
        List<String> toolNameList = new ArrayList<>();
        List<String> formattedToolList = new ArrayList<>();
        // 遍历类中的所有方法
        for (Method declaredMethod : clazz.getDeclaredMethods()) {
            // 检查是否有 @Tool 注解
            if (declaredMethod.isAnnotationPresent(Tool.class)) {
                Tool toolAnnotation = declaredMethod.getAnnotation(Tool.class);
                String toolName = declaredMethod.getName();
                String toolDescription = toolAnnotation.description();
                // 获取参数描述
                String paramDescription = declaredMethod
                        .getParameters()[0].getAnnotation(ToolParam.class).description();
                // 格式化工具描述
                String formattedTool = String.format(
                        "- toolName=%s, toolDescription=%s, paramDescription=%s",
                        toolName, toolDescription, paramDescription);
                formattedToolList.add(formattedTool);
                toolNameList.add(toolName);
            }
        }
        return String.join("\n\n", formattedToolList);
    }
}

- toolName=writeFile, toolDescription=将指定内容写入本地文件。, paramDescription=包含 'file_path' 和 'content' 的 JSON 字符串。

public class AgentTools {
    private final ObjectMapper objectMapper = new ObjectMapper();

    /**
     * 将指定内容写入本地文件。
     * @param jsonInput 一个包含 'file_path' 和 'content' 的 JSON 字符串。
     * @return 执行结果的描述字符串。
     */
    @Tool(description = "将指定内容写入本地文件。")
    public String writeFile(@ToolParam(description = "包含 'file_path' 和 'content' 的 JSON 字符串。") String jsonInput) {
        try {
            // 解析 JSON 输入
            JsonNode rootNode = objectMapper.readTree(jsonInput);
            String filePath = rootNode.get("file_path").asText();
            String content = rootNode.get("content").asText();
            // 执行文件写入
            try (FileWriter writer = new FileWriter(filePath)) {
                writer.write(content);
                return "写入成功";
            } catch (IOException e) {
                return String.format("写入文件 '%s' 时发生错误：%s", filePath, e.getMessage());
            }
        } catch (Exception e) {
            return String.format("解析输入或执行工具时出错：%s", e.getMessage());
        }
    }
}

private static final String REACT_PROMPT_TEMPLATE = """
# 角色定义
你是一个强大的 AI 助手，通过思考和使用工具来解决用户的问题。

# 任务
你的任务是尽你所能回答以下问题。你可以使用以下工具：
{tools}

# 规则
- Action 中只需要返回工具的名字，比如 writeFile，不要返回以下格式 toolName=writeFile
- 每次只做一次 Reason/Action/ActionInput 或者 FinalAnswer 的输出过程，不要一次性都做了
- 每次返回的过程中不要自己生成 Observation 的内容
- 返回 Reason/Action/ActionInput 的时候不要生成并返回 Observation 的内容

# 输出过程参考
第一轮
Reason: 你思考的过程
Action: 你的下一步动作，你想要执行的工具是哪个，必须是{tools}中的一个
ActionInput: 你要调用的工具的输入参数是什么

第二轮
Reason: 你思考的过程
Action: 你的下一步动作
ActionInput: 你要调用的工具的输入参数
...
最后一轮
FinalAnswer: 表示最终的答案，只需要最后输出就可以了

# 用户需求
Question: {input}

# 历史聊天记录
{history}
""";

部分	作用	设计考量
角色定义	设定 AI 的身份和能力边界	让模型明确自己是一个"使用工具解决问题"的助手
工具清单	告知可用工具	`{tools}` 占位符会被替换为实际的工具描述
规则约束	控制输出格式	防止模型自行编造 Observation，确保每轮只输出一次
输出示例	引导输出格式	通过多轮对话示例展示期望的输出结构
历史记录	维持上下文	`{history}` 保存之前的推理过程，实现"记忆"能力

public class ReActAgent {
    private OpenAIClient apiClient;

    public ReActAgent(OpenAIClient apiClient) {
        this.apiClient = apiClient;
    }

    public String run(String input) throws NoSuchMethodException {
        // 1. 注册可用工具
        HashMap<String, Method> tools = new HashMap<>();
        tools.put("writeFile", AgentTools.class.getMethod("writeFile", String.class));
        // 2. 初始化历史记录，用于维护推理上下文
        StringBuilder history = new StringBuilder();
        // 3. 最大循环次数，防止无限循环
        int i = 0;
        while (i < 10) {
            try {
                // 4. 构建完整 Prompt
                String prompt = buildPrompt(input, history.toString());
                // 5. 调用大模型
                ChatCompletionCreateParams params = ChatCompletionCreateParams.builder()
                        .addUserMessage(prompt)
                        .model(ModelConfig.LLM_NAME)
                        .build();
                ChatCompletion chatCompletion = apiClient.chat().completions().create(params);
                String rawLlmOutput = chatCompletion.choices().get(0).message().content().get();
                System.out.println("大模型原始输出：" + rawLlmOutput);
                // 6. 解析 LLM 输出
                ParsedOutput parsedOutput = parseLlmOutput(rawLlmOutput);
                // 7. 如果是最终答案，直接返回
                if (parsedOutput.type.equals("final_answer")) {
                    return parsedOutput.answer;
                }
                // 8. 执行工具并获取结果
                String observation = executeTool(parsedOutput, tools);
                System.out.println("工具执行结果：" + observation);
                // 9. 更新历史记录
                history.append("Reason: ").append(parsedOutput.reason).append("\n")
                        .append("Action: ").append(parsedOutput.action).append("\n")
                        .append("ActionInput: ").append(parsedOutput.actionInputStr).append("\n")
                        .append("Observation: ").append(observation).append("\n");
            } catch (Exception e) {
                e.printStackTrace();
                i++;
            }
        }
        return "达到了循环最大次数";
    }
}

private String buildPrompt(String input, String history) {
    String prompt = REACT_PROMPT_TEMPLATE.replace("{tools}", ToolUtil.getToolDescription(AgentTools.class));
    prompt = prompt.replace("{input}", input);
    prompt = prompt.replace("{history}", history);
    return prompt;
}

private ParsedOutput parseLlmOutput(String llmOutput) {
    // 1. 检查是否为最终答案
    if (llmOutput.contains("FinalAnswer: ")) {
        return new ParsedOutput("final_answer", llmOutput.split("FinalAnswer: ")[1].strip(), null, null, null, null);
    }
    // 2. 使用正则表达式提取 Reason、Action、ActionInput
    Pattern actionPattern = Pattern.compile("Reason:(.*?)Action:(.*?)ActionInput:(.*)", Pattern.DOTALL);
    Matcher matcher = actionPattern.matcher(llmOutput);
    if (matcher.find()) {
        String reason = matcher.group(1).trim();
        String action = matcher.group(2).trim();
        String actionInputStr = matcher.group(3).trim();
        // 3. 处理可能的 Markdown 代码块格式
        if (actionInputStr.startsWith("```json")) {
            actionInputStr = actionInputStr.substring(7);
        }
        if (actionInputStr.endsWith("```")) {
            actionInputStr = actionInputStr.substring(0, actionInputStr.length() - 3);
        }
        actionInputStr = actionInputStr.trim();
        return new ParsedOutput("action", null, reason, action, actionInputStr, null);
    }
    // 4. 解析失败
    return new ParsedOutput("error", null, null, null, null, String.format("解析 LLM 输出失败：'%s'", llmOutput));
}

// 使用 Java Record 定义解析结果数据结构
private record ParsedOutput(String type, // 输出类型：final_answer / action / error
                            String answer, // 最终答案（当 type 为 final_answer 时）
                            String reason, // 推理过程
                            String action, // 要执行的工具名
                            String actionInputStr, // 工具输入参数（JSON 字符串）
                            String message // 错误信息（当 type 为 error 时）
) {}

private static String executeTool(ParsedOutput parsedOutput, HashMap<String, Method> tools)
        throws IllegalAccessException, InvocationTargetException {
    String toolName = parsedOutput.action;
    String toolParams = parsedOutput.actionInputStr;
    // 根据工具名查找方法
    Method toolMethod = tools.get(toolName);
    // 通过反射调用工具方法
    Object observation = toolMethod.invoke(new AgentTools(), toolParams);
    return String.valueOf(observation);
}

public static void main(String[] args) throws Exception {
    // 1. 创建 OpenAI 客户端
    OpenAIClient apiClient = OpenAIOkHttpClient.builder()
            .apiKey(ModelConfig.API_KEY)
            .baseUrl(ModelConfig.BASE_URL)
            .build();
    // 2. 创建 ReAct Agent
    ReActAgent reActAgent = new ReActAgent(apiClient);
    // 3. 执行任务
    String result = reActAgent.run("将 1 到 10 中间的所有整数写到文件中");
    // 4. 输出结果
    System.out.println("最终结果：" + result);
}

大模型原始输出：Reason: 用户需要将 1 到 10 之间的所有整数写入到一个文件中。我需要使用 writeFile 工具来完成这个任务，需要指定文件路径和内容。
Action: writeFile
ActionInput:{"file_path":"numbers.txt","content":"1\n2\n3\n4\n5\n6\n7\n8\n9\n10"}
工具执行结果：写入成功
大模型原始输出：Reason: 文件已经成功写入，用户的任务已经完成。
FinalAnswer: 我已经成功将 1 到 10 之间的所有整数写入到了 numbers.txt 文件中。
最终结果：我已经成功将 1 到 10 之间的所有整数写入到了 numbers.txt 文件中。

轮次	阶段	内容
1	Reason	分析用户需求，决定使用 writeFile 工具
1	Action	writeFile
1	ActionInput	构造 JSON 参数，包含文件路径和内容
1	Observation	系统执行工具后返回"写入成功"
2	Reason	观察到成功结果，判断任务完成
2	FinalAnswer	返回最终答案给用户

// 当前实现
while (i < 10) {
    try {
        // ... 正常逻辑
    } catch (Exception e) {
        i++; // 只有异常时才递增
    }
}

// 建议改进
while (i < 10) {
    try {
        // ... 正常逻辑
    } catch (Exception e) {
        e.printStackTrace();
    }
    i++; // 每轮都递增
}

private static String safeExecuteTool(ParsedOutput parsedOutput, HashMap<String, Method> tools) {
    String toolName = parsedOutput.action;
    // 检查工具是否存在
    Method toolMethod = tools.get(toolName);
    if (toolMethod == null) {
        return "未知工具：" + toolName + "。请检查工具清单并重新选择。";
    }
    // ... 执行工具逻辑
}

private static HashMap<String, Method> registerTools(Class<?> toolClass) {
    HashMap<String, Method> tools = new HashMap<>();
    for (Method method : toolClass.getDeclaredMethods()) {
        if (method.isAnnotationPresent(Tool.class)) {
            tools.put(method.getName(), method);
        }
    }
    return tools;
}

// 使用
HashMap<String, Method> tools = registerTools(AgentTools.class);

// 最小 JSON 校验
if (toolParams == null || !toolParams.trim().startsWith("{") || !toolParams.trim().endsWith("}")) {
    return "ActionInput 不是合法 JSON 对象，请输出形如 {\"key\":\"value\"} 的参数。";
}

@Tool(description = "读取本地文件内容")
public String readFile(@ToolParam(description = "文件路径") String filePath) {
    try {
        return Files.readString(Path.of(filePath));
    } catch (IOException e) {
        return "读取文件失败：" + e.getMessage();
    }
}

@Tool(description = "执行网络搜索")
public String webSearch(@ToolParam(description = "搜索关键词的 JSON") String jsonInput) {
    // 调用搜索 API 实现
}

@Tool(description = "执行数学计算")
public String calculate(@ToolParam(description = "包含 expression 的 JSON") String jsonInput) {
    // 使用表达式求值库实现
}

维度	手写实现	LangChain	Spring AI
学习价值	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
灵活性	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐
开发效率	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
生产就绪	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
社区生态	⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐

public class ChatMemory {
    private final List<Message> messages = new ArrayList<>();

    public void addMessage(Message message) {
        messages.add(message); // 可选：持久化到数据库
    }

    public String getHistory() {
        return messages.stream().map(Message::toString).collect(Collectors.joining("\n"));
    }
}

List<CompletableFuture<String>> futures = actions.stream()
        .map(action -> CompletableFuture.supplyAsync(() -> executeTool(action)))
        .toList();
List<String> results = futures.stream().map(CompletableFuture::join).toList();

apiClient.chat().completions().createStream(params).forEach(chunk -> {
    String content = chunk.choices().get(0).delta().content().orElse("");
    System.out.print(content); // 实时输出
});

主题	内容要点
ReAct 原理	推理与行动交替进行，通过观察结果迭代优化
工具系统	基于注解的声明式定义，反射机制自动发现
Prompt 工程	角色设定、规则约束、示例引导、历史记录
输出解析	正则匹配提取结构化信息，处理多种输出格式
循环控制	最大次数限制、终止条件判断、异常处理

基于 Java 从零实现 ReAct 模式 AI Agent

引言

一、什么是 ReAct 模式？

1.1 ReAct 的起源与核心思想

1.2 ReAct 与思维链（CoT）的对比

1.3 ReAct 的核心执行循环

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.4 一个具体的执行示例

二、项目架构设计

2.1 系统架构图

2.2 核心组件职责

2.3 项目依赖

三、核心代码实现详解

3.1 模型配置（ModelConfig）

3.2 工具注解系统（Tool / ToolParam）

3.3 工具描述生成器（ToolUtil）

3.4 实现具体工具（AgentTools）

3.5 Prompt 模板设计

3.6 核心 Agent 循环（ReActAgent）

3.7 输出解析器

3.8 工具执行器

四、完整执行示例

4.1 启动代码

4.2 执行过程输出

4.3 执行流程分析

五、工程化改进建议

5.1 循环计数修复

5.2 未知工具处理

5.3 自动工具注册

5.4 参数校验增强

5.5 更多工具示例

六、与主流框架的对比

七、进阶扩展方向

7.1 多轮对话记忆

7.2 并行工具调用

7.3 流式输出

7.4 更高级的 Agent 架构

八、总结

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具