Web-Rooter：基于 IR + Lint 模式的 AI Agent 联网工具 | 极客日志

PythonAI算法

Web-Rooter：基于 IR + Lint 模式的 AI Agent 联网工具

Web-Rooter 是一个面向 AI Agent 的 CLI 联网工具集合，旨在提供本地化联网能力。其核心创新在于采用 IR（中间表示）+ Lint（语法检查）机制，将自然语言任务编译为可执行指令，显著降低 AI 幻觉率。工具包含 28 个 MCP 接口，覆盖搜索、爬虫、学术及垂直领域查询。架构上以 CLI 为核心，MCP 为适配层，支持作业管理、预算控制及生产级运维观测。适用于需要可追溯、可审计的 AI 联网场景，如技术调研、合规报告及个人研究。

ArchDesign发布于 2026/4/5更新于 2026/5/2634 浏览

Web-Rooter：基于 IR + Lint 模式的 AI Agent 联网工具

一、Web-Rooter 简介

这是一个开源项目，提供深度搜索、深度分析、深度爬虫等能力。

Web-Rooter 不是'给人长期手敲的爬虫工具'，而是'给 AI 调用的标准化联网协议层'。

目标是把'AI 看起来答对但没有来源'升级成'AI 有执行链路、有引用、可审计'。

1.1 第一层理解：从形式意义看 Web-Rooter

从最基础的层面来说，Web-Rooter 是一个让 Claude Code / Cursor / OpenClaw 等 Vibe Coding / AI Agent 工具实现本地化联网能力的 CLI 工具集合。

关键点：

Web-Rooter 不是 MCP，而是 CLI 集合。

这意味着它可以以系统级方式与任何 AI 工具组合使用，且整体效率远高于 MCP。它不是'给某个 IDE 或某个 Agent 用的插件'，而是一个通用的、可组合的、可扩展的 AI 联网执行核心。

1.2 第二层理解：IR + Lint ——把自然语言任务当成代码来编译

Web-Rooter 借鉴编译器思想设计的 IR + Lint 机制，用于显著降低幻觉率。

以 wr do 指令为例，它的执行流程是：

Intent → Skill → IR → Lint → Execute

也就是说，它会把自然语言任务'编译'为中间表示（IR），再进行语法/语义检查（Lint），最后才执行。

这个设计非常巧妙。因为像 Claude Code 这类工具虽然强大，但它们有自己的顶层提示词，在长对话中经常会'忘记'用户自定义的 MCP 或 CLI 工具的使用方式。而 IR + Lint 的存在，就像一位严厉的老师不断提醒 AI：

'你要先复习技能，再执行任务。'

我实际测试下来，这套机制确实能显著提升 AI 调用工具的灵活性与稳定性，任务处理效率也高了不少。当然，由于项目刚开源，目前 IR + Lint 仍处于'能跑但细节待优化'的阶段。

1.3 第三层理解：把 skills 放在 CLI 返回结果里，而不是放在文件夹里

Web-Rooter 做了一个非常有趣的设计：

它把 skills 放在 CLI 指令的返回结果中，而不是像 Claude Code / Cursor / OpenClaw 那样放在统一文件夹下。

这意味着：

每个粗粒度 skill 被拆分成多个细粒度 skill
不同任务阶段会触发不同的细粒度 skill
AI 在执行任务时会不断收到'开卷提示'

这种细粒度提示词对 AI 行为的约束力更强，也能极大降低幻觉率。

1.4 其他亮点

Web-Rooter 还基于 CLI 集合衍生出了 28 个 MCP，整体功能相当丰富。

它的定位也非常明确：

不试图成为万能工具，而是让 AI 的联网行为变得可追溯、可验证。

换句话说，它不是让自己变得万能，而是让所有通用 AI 工具变得更万能。

二、快速部署 Web-Rooter

Web-Rooter 上手比较容易，即使是一台完全空白、没有任何开发环境的电脑也能轻松部署。

2.1 安装方式

Windows：运行 install-web-rooter.bat
macOS/Linux：运行 ./install-web-rooter.sh

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# Windows install.bat # macOS / Linux bash install.sh

wr --version wr doctor wr help

┌─────────────────────────────────────────────────┐
│ Interface Layer (接口层)                        │
│ main.py / tools/ / scripts/                     │
│ CLI / MCP / HTTP Server 启动分发                 │
├─────────────────────────────────────────────────┤
│ Orchestration Layer (编排层)                    │
│ agents/web_agent.py                             │
│ 任务编排：visit/search/research/crawl           │
├─────────────────────────────────────────────────┤
│ Capability Layer (能力层)                       │
│ core/crawler.py, browser.py, search/*           │
│ HTTP 抓取、浏览器自动化、搜索引擎聚合             │
├─────────────────────────────────────────────────┤
│ Configuration Layer (配置层)                    │
│ config.py, core/engine-config/*.json            │
│ 全局运行参数、引擎配置                          │
├─────────────────────────────────────────────────┤
│ Validation Layer (验证层)                       │
│ wr doctor, ir-lint, safe-mode                   │
│ 环境检查、IR 语法验证、安全模式                   │
└─────────────────────────────────────────────────┘

工具	用途
`web_fetch`	HTTP 网页访问
`web_fetch_js`	浏览器网页访问（JS 渲染）
`web_search`	在已访问内容中检索
`parse_html`	HTML 解析
`get_links`	链接提取

工具	用途
`web_search_internet`	多引擎互联网搜索
`web_deep_search`	深度并行搜索（多引擎 + 多查询）
`web_search_combined`	搜索 + 抓取组合
`web_research`	主题深度研究

工具	用途
`web_search_academic`	学术搜索（arXiv, Google Scholar, PubMed, IEEE, CNKI 等 10 源）
`web_search_social`	社交媒体搜索（小红书、知乎、抖音、B 站、微博、Reddit、Twitter）
`web_search_commerce`	电商/本地生活平台搜索（淘宝、京东、拼多多、美团）
`web_search_tech`	技术社区搜索
`web_mindsearch`	MindSearch 图研究

工具	用途
`web_budget_telemetry`	运行时预算遥测快照（health/pressure/utilization/alerts）
`web_workflow_schema`	声明式 workflow schema（供 AI 自主编排）
`web_workflow_run`	运行 workflow 任务流
`web_auth_hint`	指定 URL 的登录态匹配与提示
`web_context_snapshot`	全局深度抓取上下文快照

wr help
wr --version
wr doctor
wr do<任务>[--skill=name][--dry-run][--strict][--js][--top=N][--crawl-assist][--crawl-pages=N][--command-timeout-sec=N][--html-first|--no-html-first]
wr do-plan <任务>[--skill=name][--strict][--js][--top=N][--crawl-assist][--crawl-pages=N][--html-first|--no-html-first]
wr do-submit <任务>[--skill=name][--strict][--js][--top=N][--crawl-assist][--crawl-pages=N][--timeout-sec=N][--html-first|--no-html-first]

wr jobs[--limit=N][--status=queued|running|completed|failed]
wr jobs-clean [--keep=N][--days=N][--all]
wr job-status <job_id>[--with-result]
wr job-result <job_id>

wr quick <查询>[--js][--top=N][--crawl-pages=N][--strict][--command-timeout-sec=N]
wr visit <URL>[--js]
wr html <URL>[--js][--max-chars=N][--no-fallback]

wr web <查询>[--no-crawl][--crawl-pages=N][--num-results=N][--engine=name|a,b]
wr deep <查询>[--en][--crawl=N][--num-results=N][--variants=N][--engine=name|a,b][--news][--platforms][--commerce][--channel=x,y]
wr mindsearch <查询>[--turns=N][--branches=N][--num-results=N][--crawl=N][--planner=name][--strict-expand][--channel=x,y]

wr social [--platform=xiaohongshu|zhihu|tieba|douyin|bilibili|weibo|reddit|twitter]
wr shopping [--platform=taobao|jd|pinduoduo|meituan]
wr academic [--papers-only|--with-code][--no-abstracts][--num-results=N][--source=xxx]
wr crawl <URL>[pages][depth][--pattern=REGEX][--allow-external][--no-subdomains]

wr workflow-schema
wr workflow-template [path][--scenario=social_comments|academic_relations][--force]
wr workflow <path>[--var key=value][--set key=value][--strict][--dry-run]
wr processors [--load=module:object][--force]
wr planners [--load=module:object][--force]
wr challenge-profiles
wr auth-profiles
wr auth-hint
wr auth-template [path][--force]

wr context [--limit=N][--event=type]
wr telemetry [--no-refresh]
wr pressure [--no-refresh]
wr events [--limit=N][--event=type][--source=name][--since=seq]
wr artifact [--nodes=N][--edges=N][--kind=page|url|domain|request|session]
wr safe-mode [status|on|off][--policy=strict]
wr skills [--resolve "<目标>"][--compact|--full]
wr ir-lint <IR/JSON>

Web-Rooter：基于 IR + Lint 模式的 AI Agent 联网工具

一、Web-Rooter 简介

1.1 第一层理解：从形式意义看 Web-Rooter

1.2 第二层理解：IR + Lint ——把自然语言任务当成代码来编译

1.3 第三层理解：把 skills 放在 CLI 返回结果里，而不是放在文件夹里

1.4 其他亮点

二、快速部署 Web-Rooter

2.1 安装方式

更多推荐文章

相关免费在线工具

2.2 验证安装

2.3 系统要求

三、技术架构：CLI 是一等接口，MCP 只是适配层

四、28 个 MCP 工具：覆盖 AI 联网的全场景

4.1 基础工具

4.2 搜索工具（核心）

4.3 垂直领域工具（差异化优势）

4.4 运维工具（生产级思维）

五、CLI 命令全集：按场景分层设计

5.1 核心命令

5.2 作业管理

5.3 快速查询

5.4 搜索与研究

5.5 垂直领域

5.6 工作流与扩展

5.7 运维观测

六、总结：Web-Rooter 代表了一种正确的方向

更多推荐文章

相关免费在线工具

Web-Rooter：基于 IR + Lint 模式的 AI Agent 联网工具

一、Web-Rooter 简介

1.1 第一层理解：从形式意义看 Web-Rooter

1.2 第二层理解：IR + Lint ——把自然语言任务当成代码来编译

1.3 第三层理解：把 skills 放在 CLI 返回结果里，而不是放在文件夹里

1.4 其他亮点

二、快速部署 Web-Rooter

2.1 安装方式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 验证安装

2.3 系统要求

三、技术架构：CLI 是一等接口，MCP 只是适配层

四、28 个 MCP 工具：覆盖 AI 联网的全场景

4.1 基础工具

4.2 搜索工具（核心）

4.3 垂直领域工具（差异化优势）

4.4 运维工具（生产级思维）

五、CLI 命令全集：按场景分层设计

5.1 核心命令

5.2 作业管理

5.3 快速查询

5.4 搜索与研究

5.5 垂直领域

5.6 工作流与扩展

5.7 运维观测

六、总结：Web-Rooter 代表了一种正确的方向

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具