【CLI-Anything 】让所有软件都能被AI Agent原生调用

CLI-Anything

一、项目概述

CLI-Anything 是由香港大学数据科学实验室(HKUDS)开发的开源项目,核心目标是让所有软件都能被AI Agent原生调用。项目口号:“Today’s Software Serves Humans 👨‍💻. Tomorrow’s Users will be Agents 🤖”

项目指标数值
Stars1.1k
Forks110
Watchers7
主要语言Python (99.7%)
测试通过率100% (1,436 tests)

二、核心问题与解决方案

2.1 现有痛点
痛点具体表现
AI无法使用真实工具现有方案要么是脆弱的UI自动化,要么是功能阉割的重新实现
UI自动化不可靠截图、点击、RPA等方式容易崩溃
Agent需要结构化数据缺乏标准化的输出格式
定制集成成本高每个软件都需要单独开发接口
原型与生产差距大缺乏真实软件验证
2.2 CLI-Anything的解决思路

核心洞察:CLI(命令行界面)是人类和AI Agent的通用接口

  • ✅ 结构化且可组合 — 文本命令匹配LLM格式,可链式组合复杂工作流
  • ✅ 轻量且通用 — 最小开销,跨系统无依赖
  • ✅ 自描述 — --help 标志提供自动文档,Agent可自动发现
  • ✅ 已验证成功 — Claude Code每天通过CLI运行数千个真实工作流
  • ✅ Agent优先设计 — 结构化JSON输出消除解析复杂性
  • ✅ 确定且可靠 — 一致结果实现可预测的Agent行为

三、技术架构

3.1 七阶段全自动流水线
/cli-anything <software-path-or-repo> ↓ 1. 🔍 Analyze(分析)— 扫描源代码,映射GUI动作到API 2. 📐 Design(设计)— 架构命令组、状态模型、输出格式 3. 🔨 Implement(实现)— 构建Click CLI,含REPL、JSON输出、撤销/重做 4. 📋 Plan Tests(规划测试)— 创建TEST.md,含单元测试+E2E测试计划 5. 🧪 Write Tests(编写测试)— 实现全面测试套件 6. 📝 Document(文档)— 更新TEST.md结果 7. 📦 Publish(发布)— 创建setup.py,安装到PATH 
3.2 核心设计原则
原则说明
真实软件集成CLI必须调用实际应用进行渲染,不是替代而是封装
灵活交互模式有状态REPL + 子命令接口,裸命令进入REPL模式
一致用户体验统一REPL界面(repl_skin.py),品牌横幅、样式提示、命令历史
Agent原生设计内置--json标志,标准--helpwhich命令发现能力
零妥协依赖真实软件是硬性要求,缺失时测试失败而非跳过

四、已验证的9个生产级CLI

软件领域CLI命令后端技术测试数
🎨 GIMP图像编辑cli-anything-gimpPillow + GEGL/Script-Fu107
🧊 Blender3D建模与渲染cli-anything-blenderbpy (Python脚本)208
✏️ Inkscape矢量图形cli-anything-inkscape直接SVG/XML操作202
🎵 Audacity音频制作cli-anything-audacityPython wave + sox161
📄 LibreOffice办公套件cli-anything-libreofficeODF生成 + 无头LO158
📹 OBS Studio直播与录制cli-anything-obs-studioJSON场景 + obs-websocket153
🎞️ Kdenlive视频编辑cli-anything-kdenliveMLT XML + melt渲染器155
🎬 Shotcut视频编辑cli-anything-shotcut直接MLT XML + melt154
📐 Draw.io图表绘制cli-anything-drawiomxGraph XML + draw.io CLI138
总计1,436

测试构成:1,011单元测试 + 425 E2E测试,100%通过率


五、使用方式

5.1 快速开始(Claude Code插件)
# 添加市场 /plugin marketplace add HKUDS/CLI-Anything # 安装插件 /plugin install cli-anything # 一键生成CLI(以GIMP为例) /cli-anything ./gimp 
5.2 手动安装
git clone https://github.com/HKUDS/CLI-Anything.git cp-r CLI-Anything/cli-anything-plugin ~/.claude/plugins/cli-anything /reload-plugins 
5.3 使用生成的CLI
# 安装到PATHcd gimp/agent-harness && pip install-e.# 查看帮助 cli-anything-gimp --help# 创建项目 cli-anything-gimp project new --width1920--height1080-o poster.json # JSON模式(供Agent使用) cli-anything-gimp --json layer add-n"Background"--type solid --color"#1a1a2e"# 进入交互式REPL cli-anything-gimp 

六、插件命令集

命令功能
/cli-anything <path-or-repo>完整构建CLI(全部7阶段)
/cli-anything:refine <path> [focus]优化现有CLI,扩展覆盖范围
/cli-anything:test <path-or-repo>运行测试并更新TEST.md
/cli-anything:validate <path-or-repo>按HARNESS.md标准验证

七、项目结构

cli-anything/ ├── 📄 README.md / README_CN.md # 中英文档 ├── 📁 assets/ # 图标、演示图 ├── 🔌 cli-anything-plugin/ # Claude Code插件 │ ├── HARNESS.md # 方法论SOP(核心文档) │ ├── QUICKSTART.md # 5分钟快速开始 │ ├── PUBLISHING.md # 发布指南 │ ├── repl_skin.py # 统一REPL界面 │ └── commands/ # 插件命令定义 │ ├── cli-anything.md │ ├── refine.md │ ├── test.md │ └── validate.md ├── 🎨 gimp/agent-harness/ ├── 🧊 blender/agent-harness/ ├── ✏️ inkscape/agent-harness/ ├── 🎵 audacity/agent-harness/ ├── 📄 libreoffice/agent-harness/ ├── 📹 obs-studio/agent-harness/ ├── 🎞️ kdenlive/agent-harness/ ├── 🎬 shotcut/agent-harness/ └── 📐 drawio/agent-harness/ 

每个agent-harness/包含:

  • 可安装的Python包(cli_anything.<software>/
  • Click CLI实现
  • 核心模块
  • 工具(含repl_skin.py和后端包装器)
  • 全面测试

八、关键方法论:HARNESS.md

HARNESS.md是项目的标准操作程序(SOP),编码了通过自动化生成流程提炼的成熟模式。

关键经验教训
教训详细说明
使用真实软件CLI必须调用实际应用渲染,不能用Pillow替代GIMP,不能用自定义渲染器替代Blender
渲染差距问题GUI应用在渲染时才应用效果,若CLI操作项目文件但使用简单导出工具,效果会被静默丢弃
滤镜转换MLT→ffmpeg等格式映射时注意:重复滤镜合并、交错流排序、参数空间差异、不可映射效果
时间码精度非整数帧率(29.97fps)导致累积舍入,用round()而非int(),显示用整数运算,测试容差±1帧
输出验证不能因退出码0就信任导出成功,需验证:magic bytes、ZIP/OOXML结构、像素分析、音频RMS电平、时长检查

九、应用场景分类

类别如何Agent化典型示例
📂 GitHub仓库自动CLI生成将任何开源项目转为Agent可控工具VSCodium, WordPress, Calibre, Zotero, Joplin
🤖 AI/ML平台结构化命令自动化模型训练、推理流程、超参调优Stable Diffusion, ComfyUI, InvokeAI, Fooocus
📊 数据分析程序化数据处理、可视化、统计分析工作流JupyterLab, Superset, Metabase, DBeaver
💻 开发工具命令接口简化代码编辑、构建、测试、部署Jenkins, Gitea, Portainer, SonarQube
🎨 创意媒体程序化控制内容创作、编辑、渲染工作流Blender, GIMP, OBS, Krita, Kdenlive
🔬 科学计算自动化研究工作流、仿真、复杂计算ImageJ, FreeCAD, QGIS, ParaView, KiCad
🏢 企业办公将业务应用和生产力工具转为Agent可访问系统NextCloud, GitLab, Grafana, LibreOffice, ERPNext
📐 图表可视化程序化创建和操作图表、流程图、架构图Draw.io, Mermaid, PlantUML, Excalidraw
✨ AI内容生成通过AI云API生成专业交付物(幻灯片、文档、图表)AnyGen, Gamma, Beautiful.ai, Tome

十、愿景与路线图

10.1 核心愿景
  • 🌐 通用访问 — 每个软件都通过结构化CLI即时Agent可控
  • 🔗 无缝集成 — Agent无需API、GUI、重建或复杂包装器即可控制任何应用
  • 🚀 未来就绪生态 — 一条命令将人类设计的软件转为Agent原生工具
10.2 路线图
  • 支持更多应用类别(CAD、DAW、IDE、EDA、科学工具)
  • Agent任务完成率基准测试套件
  • 社区贡献的内部/定制软件CLI
  • 与Claude Code之外的更多Agent框架集成
  • 支持将闭源软件和Web服务的API打包为CLI
  • 生成SKILL.md供Agent技能发现和编排

十一、核心洞察总结

  1. CLI是Agent时代的通用语言 — 不是替代GUI,而是为Agent提供结构化接口
  2. 真实软件调用是关键 — 生成有效项目文件→调用真实后端,拒绝玩具实现
  3. 测试即文档 — 1,436个测试不仅是质量保证,更是功能规格说明
  4. 方法论可复现 — HARNESS.md将经验编码为可执行的标准
  5. 插件化降低门槛 — 通过Claude Code插件市场实现一键CLI生成

Read more

Spring Boot 集成 Neo4j 图数据库实战教程

Spring Boot 集成 Neo4j 图数据库实战教程

在当今大数据时代,传统的关系型数据库在处理复杂关系网络时往往力不从心。Neo4j 作为领先的图数据库,能够高效地存储和查询海量关系数据。本文将详细介绍如何在 Spring Boot 项目中集成 Neo4j,并提供完整的实战案例,帮助读者快速掌握图数据库的开发技巧。 一、图数据库概述与 Neo4j 简介 1.1 为什么选择图数据库 在传统的关系型数据库中,当我们需要查询"朋友的朋友"这样的多跳关系时,往往需要编写复杂的多表关联查询,性能随关系层数增加呈指数级下降。而图数据库天然适合处理这类场景,它将数据之间的关系作为核心Citizens,利用图遍历算法高效地查询关系网络。 图数据库的核心优势体现在以下几个方面。首先是性能优势,对于深度关系查询,图数据库的性能是关系型数据库的数倍甚至数十倍。其次是灵活性优势,图数据库的 schema 更加灵活,可以随时添加新的节点类型和关系类型,而无需修改表结构。第三是表达力优势,图的数据模型更加直观,使用节点和边来描述现实世界的关系,与人类的思维方式更加契合。 Neo4j 是目前最流行的图数据库之一,它使用 Cypher 查询语言,具有高性能

Angular应用在Chrome中调用高德地图API定位超时问题解析与安全方案

1. 问题现象:为什么我的Angular应用在Chrome里定位总是“转圈圈”? 最近在做一个基于Angular的项目,需要集成高德地图来实现用户位置获取。功能在Edge、Firefox上跑得挺顺溜,可一到Chrome上就卡壳了——那个定位的小图标转啊转,最后给你弹出一个“定位超时”(Geolocation Timeout)的错误。这事儿别提多闹心了,明明代码一样,高德地图的Key也配置对了,怎么换个浏览器就不灵了呢? 一开始我也以为是自己的代码写错了,反复检查了@types/amap-js-api的类型声明,确认AMap.Geolocation的调用方式没问题。后来一搜,发现不少用Vue、React甚至原生JS开发的朋友,只要在Chrome里调用高德地图定位,都踩过这个坑。这就有点意思了,看来不是我们前端框架的锅,问题可能出在更底层的地方。最让人困惑的是,有时候你开了“科学上网”工具,诶,定位居然成功了!但这显然不是个正经的解决方案,且不说安全性和稳定性,你总不能要求每个用户都先去折腾网络配置吧。 这个问题的核心体验就是:在Chrome浏览器中,通过高德地图JavaScript

AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例

AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例

* 本文重点在于文心大模型的微调 * 一起来轻松玩转文心大模型吧👉一文心大模型免费下载地址: https://ai.gitcode.com/theme/1939325484087291906 计算机配置 * 在国内部署选个自带CUDA的会快一点,不自带还得去NVIDIA下载,而其提供的CUDA依赖需要科学上网才能下载快。换阿里清华源也没用。 * 文心模型汇总 环境配置与部署 1. 更换镜像源(使用阿里云镜像源): sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak sudo sed -i 's|http://archive.ubuntu.com/ubuntu|http://mirrors.aliyun.com/ubuntu|g' /etc/apt/sources.

从低代码到 AI 智能体:VTJ.PRO 2.0 深度解析

技术白皮书 版本 1.0 | 2026年3月 摘要 随着企业数字化转型进入深水区,软件开发效率与质量的双重压力推动着开发工具的持续演进。VTJ.PRO 作为一款 AI 驱动的 Vue3 低代码开发平台,在 2026 年初发布的 2.0 版本中实现了从“低代码工具”到“AI 原生应用开发平台”的质变跃迁。本白皮书将深入解析 VTJ.PRO 2.0 的核心架构、技术创新及其实践价值,揭示其如何通过“AI 智能体+前后端一体+企业级工程化”的三位一体架构,重新定义现代应用开发范式。 第一章:背景与愿景 1.1 低代码开发的演进困局 传统低代码平台在过去十年中虽然显著提升了开发效率,但也面临三大核心挑战: 平台锁定风险:多数平台生成代码依赖私有运行时,一旦采用便难以脱离,