【CLI-Anything 】让所有软件都能被AI Agent原生调用

CLI-Anything

一、项目概述

CLI-Anything 是由香港大学数据科学实验室(HKUDS)开发的开源项目,核心目标是让所有软件都能被AI Agent原生调用。项目口号:“Today’s Software Serves Humans 👨‍💻. Tomorrow’s Users will be Agents 🤖”

项目指标数值
Stars1.1k
Forks110
Watchers7
主要语言Python (99.7%)
测试通过率100% (1,436 tests)

二、核心问题与解决方案

2.1 现有痛点
痛点具体表现
AI无法使用真实工具现有方案要么是脆弱的UI自动化,要么是功能阉割的重新实现
UI自动化不可靠截图、点击、RPA等方式容易崩溃
Agent需要结构化数据缺乏标准化的输出格式
定制集成成本高每个软件都需要单独开发接口
原型与生产差距大缺乏真实软件验证
2.2 CLI-Anything的解决思路

核心洞察:CLI(命令行界面)是人类和AI Agent的通用接口

  • ✅ 结构化且可组合 — 文本命令匹配LLM格式,可链式组合复杂工作流
  • ✅ 轻量且通用 — 最小开销,跨系统无依赖
  • ✅ 自描述 — --help 标志提供自动文档,Agent可自动发现
  • ✅ 已验证成功 — Claude Code每天通过CLI运行数千个真实工作流
  • ✅ Agent优先设计 — 结构化JSON输出消除解析复杂性
  • ✅ 确定且可靠 — 一致结果实现可预测的Agent行为

三、技术架构

3.1 七阶段全自动流水线
/cli-anything <software-path-or-repo> ↓ 1. 🔍 Analyze(分析)— 扫描源代码,映射GUI动作到API 2. 📐 Design(设计)— 架构命令组、状态模型、输出格式 3. 🔨 Implement(实现)— 构建Click CLI,含REPL、JSON输出、撤销/重做 4. 📋 Plan Tests(规划测试)— 创建TEST.md,含单元测试+E2E测试计划 5. 🧪 Write Tests(编写测试)— 实现全面测试套件 6. 📝 Document(文档)— 更新TEST.md结果 7. 📦 Publish(发布)— 创建setup.py,安装到PATH 
3.2 核心设计原则
原则说明
真实软件集成CLI必须调用实际应用进行渲染,不是替代而是封装
灵活交互模式有状态REPL + 子命令接口,裸命令进入REPL模式
一致用户体验统一REPL界面(repl_skin.py),品牌横幅、样式提示、命令历史
Agent原生设计内置--json标志,标准--helpwhich命令发现能力
零妥协依赖真实软件是硬性要求,缺失时测试失败而非跳过

四、已验证的9个生产级CLI

软件领域CLI命令后端技术测试数
🎨 GIMP图像编辑cli-anything-gimpPillow + GEGL/Script-Fu107
🧊 Blender3D建模与渲染cli-anything-blenderbpy (Python脚本)208
✏️ Inkscape矢量图形cli-anything-inkscape直接SVG/XML操作202
🎵 Audacity音频制作cli-anything-audacityPython wave + sox161
📄 LibreOffice办公套件cli-anything-libreofficeODF生成 + 无头LO158
📹 OBS Studio直播与录制cli-anything-obs-studioJSON场景 + obs-websocket153
🎞️ Kdenlive视频编辑cli-anything-kdenliveMLT XML + melt渲染器155
🎬 Shotcut视频编辑cli-anything-shotcut直接MLT XML + melt154
📐 Draw.io图表绘制cli-anything-drawiomxGraph XML + draw.io CLI138
总计1,436

测试构成:1,011单元测试 + 425 E2E测试,100%通过率


五、使用方式

5.1 快速开始(Claude Code插件)
# 添加市场 /plugin marketplace add HKUDS/CLI-Anything # 安装插件 /plugin install cli-anything # 一键生成CLI(以GIMP为例) /cli-anything ./gimp 
5.2 手动安装
git clone https://github.com/HKUDS/CLI-Anything.git cp-r CLI-Anything/cli-anything-plugin ~/.claude/plugins/cli-anything /reload-plugins 
5.3 使用生成的CLI
# 安装到PATHcd gimp/agent-harness && pip install-e.# 查看帮助 cli-anything-gimp --help# 创建项目 cli-anything-gimp project new --width1920--height1080-o poster.json # JSON模式(供Agent使用) cli-anything-gimp --json layer add-n"Background"--type solid --color"#1a1a2e"# 进入交互式REPL cli-anything-gimp 

六、插件命令集

命令功能
/cli-anything <path-or-repo>完整构建CLI(全部7阶段)
/cli-anything:refine <path> [focus]优化现有CLI,扩展覆盖范围
/cli-anything:test <path-or-repo>运行测试并更新TEST.md
/cli-anything:validate <path-or-repo>按HARNESS.md标准验证

七、项目结构

cli-anything/ ├── 📄 README.md / README_CN.md # 中英文档 ├── 📁 assets/ # 图标、演示图 ├── 🔌 cli-anything-plugin/ # Claude Code插件 │ ├── HARNESS.md # 方法论SOP(核心文档) │ ├── QUICKSTART.md # 5分钟快速开始 │ ├── PUBLISHING.md # 发布指南 │ ├── repl_skin.py # 统一REPL界面 │ └── commands/ # 插件命令定义 │ ├── cli-anything.md │ ├── refine.md │ ├── test.md │ └── validate.md ├── 🎨 gimp/agent-harness/ ├── 🧊 blender/agent-harness/ ├── ✏️ inkscape/agent-harness/ ├── 🎵 audacity/agent-harness/ ├── 📄 libreoffice/agent-harness/ ├── 📹 obs-studio/agent-harness/ ├── 🎞️ kdenlive/agent-harness/ ├── 🎬 shotcut/agent-harness/ └── 📐 drawio/agent-harness/ 

每个agent-harness/包含:

  • 可安装的Python包(cli_anything.<software>/
  • Click CLI实现
  • 核心模块
  • 工具(含repl_skin.py和后端包装器)
  • 全面测试

八、关键方法论:HARNESS.md

HARNESS.md是项目的标准操作程序(SOP),编码了通过自动化生成流程提炼的成熟模式。

关键经验教训
教训详细说明
使用真实软件CLI必须调用实际应用渲染,不能用Pillow替代GIMP,不能用自定义渲染器替代Blender
渲染差距问题GUI应用在渲染时才应用效果,若CLI操作项目文件但使用简单导出工具,效果会被静默丢弃
滤镜转换MLT→ffmpeg等格式映射时注意:重复滤镜合并、交错流排序、参数空间差异、不可映射效果
时间码精度非整数帧率(29.97fps)导致累积舍入,用round()而非int(),显示用整数运算,测试容差±1帧
输出验证不能因退出码0就信任导出成功,需验证:magic bytes、ZIP/OOXML结构、像素分析、音频RMS电平、时长检查

九、应用场景分类

类别如何Agent化典型示例
📂 GitHub仓库自动CLI生成将任何开源项目转为Agent可控工具VSCodium, WordPress, Calibre, Zotero, Joplin
🤖 AI/ML平台结构化命令自动化模型训练、推理流程、超参调优Stable Diffusion, ComfyUI, InvokeAI, Fooocus
📊 数据分析程序化数据处理、可视化、统计分析工作流JupyterLab, Superset, Metabase, DBeaver
💻 开发工具命令接口简化代码编辑、构建、测试、部署Jenkins, Gitea, Portainer, SonarQube
🎨 创意媒体程序化控制内容创作、编辑、渲染工作流Blender, GIMP, OBS, Krita, Kdenlive
🔬 科学计算自动化研究工作流、仿真、复杂计算ImageJ, FreeCAD, QGIS, ParaView, KiCad
🏢 企业办公将业务应用和生产力工具转为Agent可访问系统NextCloud, GitLab, Grafana, LibreOffice, ERPNext
📐 图表可视化程序化创建和操作图表、流程图、架构图Draw.io, Mermaid, PlantUML, Excalidraw
✨ AI内容生成通过AI云API生成专业交付物(幻灯片、文档、图表)AnyGen, Gamma, Beautiful.ai, Tome

十、愿景与路线图

10.1 核心愿景
  • 🌐 通用访问 — 每个软件都通过结构化CLI即时Agent可控
  • 🔗 无缝集成 — Agent无需API、GUI、重建或复杂包装器即可控制任何应用
  • 🚀 未来就绪生态 — 一条命令将人类设计的软件转为Agent原生工具
10.2 路线图
  • 支持更多应用类别(CAD、DAW、IDE、EDA、科学工具)
  • Agent任务完成率基准测试套件
  • 社区贡献的内部/定制软件CLI
  • 与Claude Code之外的更多Agent框架集成
  • 支持将闭源软件和Web服务的API打包为CLI
  • 生成SKILL.md供Agent技能发现和编排

十一、核心洞察总结

  1. CLI是Agent时代的通用语言 — 不是替代GUI,而是为Agent提供结构化接口
  2. 真实软件调用是关键 — 生成有效项目文件→调用真实后端,拒绝玩具实现
  3. 测试即文档 — 1,436个测试不仅是质量保证,更是功能规格说明
  4. 方法论可复现 — HARNESS.md将经验编码为可执行的标准
  5. 插件化降低门槛 — 通过Claude Code插件市场实现一键CLI生成

Read more

一天一个开源项目(第3篇):Superpowers - 让 AI 编程助手拥有超能力的工作流框架

一天一个开源项目(第3篇):Superpowers - 让 AI 编程助手拥有超能力的工作流框架

引言 “如果 AI 编程助手不只是写代码,而是能够思考、规划、执行、审查,那该多好?” 这是"一天一个开源项目"系列的第3篇文章。今天带你了解的项目是 Superpowers(GitHub)。 想象一下,当你告诉 AI 助手"我想做一个待办事项应用"时,它不会立即开始写代码,而是先停下来问:"你真正想要解决什么问题?"然后通过对话提炼需求、设计架构、制定计划,最后自主执行整个开发流程。这就是 Superpowers 带来的革命性体验。 为什么选择这个项目? * 🧠 智能工作流:从需求分析到代码实现的完整自动化流程 * 🎯 强制最佳实践:内置 TDD、YAGNI、DRY 等开发原则 * 🔧 技能系统:可组合的技能库,自动触发相应工作流 * 🌟 社区认可:

AskGo:免费使用顶级AI的宝藏网站(Gemini 3、GPT 5.1、DeepSeek)

AskGo:免费使用顶级AI的宝藏网站(Gemini 3、GPT 5.1、DeepSeek)

这几年,AI大模型可谓是极速迭代,在激烈的竞争下,国内的AI大模型能力也有了质的飞跃,如通义千问、豆包、GLM、Kimi等。 但其实国外的AI大模型目前依然呈领先趋势,只是很多人在国内无法使用。 那么今天给大家推荐一个能够同时使用国内外顶级AI的网站——AskGo! AskGo集成了ChatGPT、DeepSeek、Gemini、Claude、Grok等数十个顶尖大模型,覆盖聊天、搜索、深度阅读、创意写作、程序开发、专业翻译、图像生成及视频生成等全场景。无需再做选择题,你可以随时利用最前沿的AI技术解决复杂问题。 AskGo为您提供「一站式AI」综合解决方案: ✅ 国内直接使用数十款顶级AI。包含GPT 5.1、Gemini 3 pro、Claude 4.5、Grok 4.1、DeepSeek满血版、Nano Banana Pro、GPT-4o绘图、Sora2、Veo3.1等顶级模型。