【CLI-Anything 】让所有软件都能被AI Agent原生调用

CLI-Anything

一、项目概述

CLI-Anything 是由香港大学数据科学实验室(HKUDS)开发的开源项目,核心目标是让所有软件都能被AI Agent原生调用。项目口号:“Today’s Software Serves Humans 👨‍💻. Tomorrow’s Users will be Agents 🤖”

项目指标数值
Stars1.1k
Forks110
Watchers7
主要语言Python (99.7%)
测试通过率100% (1,436 tests)

二、核心问题与解决方案

2.1 现有痛点
痛点具体表现
AI无法使用真实工具现有方案要么是脆弱的UI自动化,要么是功能阉割的重新实现
UI自动化不可靠截图、点击、RPA等方式容易崩溃
Agent需要结构化数据缺乏标准化的输出格式
定制集成成本高每个软件都需要单独开发接口
原型与生产差距大缺乏真实软件验证
2.2 CLI-Anything的解决思路

核心洞察:CLI(命令行界面)是人类和AI Agent的通用接口

  • ✅ 结构化且可组合 — 文本命令匹配LLM格式,可链式组合复杂工作流
  • ✅ 轻量且通用 — 最小开销,跨系统无依赖
  • ✅ 自描述 — --help 标志提供自动文档,Agent可自动发现
  • ✅ 已验证成功 — Claude Code每天通过CLI运行数千个真实工作流
  • ✅ Agent优先设计 — 结构化JSON输出消除解析复杂性
  • ✅ 确定且可靠 — 一致结果实现可预测的Agent行为

三、技术架构

3.1 七阶段全自动流水线
/cli-anything <software-path-or-repo> ↓ 1. 🔍 Analyze(分析)— 扫描源代码,映射GUI动作到API 2. 📐 Design(设计)— 架构命令组、状态模型、输出格式 3. 🔨 Implement(实现)— 构建Click CLI,含REPL、JSON输出、撤销/重做 4. 📋 Plan Tests(规划测试)— 创建TEST.md,含单元测试+E2E测试计划 5. 🧪 Write Tests(编写测试)— 实现全面测试套件 6. 📝 Document(文档)— 更新TEST.md结果 7. 📦 Publish(发布)— 创建setup.py,安装到PATH 
3.2 核心设计原则
原则说明
真实软件集成CLI必须调用实际应用进行渲染,不是替代而是封装
灵活交互模式有状态REPL + 子命令接口,裸命令进入REPL模式
一致用户体验统一REPL界面(repl_skin.py),品牌横幅、样式提示、命令历史
Agent原生设计内置--json标志,标准--helpwhich命令发现能力
零妥协依赖真实软件是硬性要求,缺失时测试失败而非跳过

四、已验证的9个生产级CLI

软件领域CLI命令后端技术测试数
🎨 GIMP图像编辑cli-anything-gimpPillow + GEGL/Script-Fu107
🧊 Blender3D建模与渲染cli-anything-blenderbpy (Python脚本)208
✏️ Inkscape矢量图形cli-anything-inkscape直接SVG/XML操作202
🎵 Audacity音频制作cli-anything-audacityPython wave + sox161
📄 LibreOffice办公套件cli-anything-libreofficeODF生成 + 无头LO158
📹 OBS Studio直播与录制cli-anything-obs-studioJSON场景 + obs-websocket153
🎞️ Kdenlive视频编辑cli-anything-kdenliveMLT XML + melt渲染器155
🎬 Shotcut视频编辑cli-anything-shotcut直接MLT XML + melt154
📐 Draw.io图表绘制cli-anything-drawiomxGraph XML + draw.io CLI138
总计1,436

测试构成:1,011单元测试 + 425 E2E测试,100%通过率


五、使用方式

5.1 快速开始(Claude Code插件)
# 添加市场 /plugin marketplace add HKUDS/CLI-Anything # 安装插件 /plugin install cli-anything # 一键生成CLI(以GIMP为例) /cli-anything ./gimp 
5.2 手动安装
git clone https://github.com/HKUDS/CLI-Anything.git cp-r CLI-Anything/cli-anything-plugin ~/.claude/plugins/cli-anything /reload-plugins 
5.3 使用生成的CLI
# 安装到PATHcd gimp/agent-harness && pip install-e.# 查看帮助 cli-anything-gimp --help# 创建项目 cli-anything-gimp project new --width1920--height1080-o poster.json # JSON模式(供Agent使用) cli-anything-gimp --json layer add-n"Background"--type solid --color"#1a1a2e"# 进入交互式REPL cli-anything-gimp 

六、插件命令集

命令功能
/cli-anything <path-or-repo>完整构建CLI(全部7阶段)
/cli-anything:refine <path> [focus]优化现有CLI,扩展覆盖范围
/cli-anything:test <path-or-repo>运行测试并更新TEST.md
/cli-anything:validate <path-or-repo>按HARNESS.md标准验证

七、项目结构

cli-anything/ ├── 📄 README.md / README_CN.md # 中英文档 ├── 📁 assets/ # 图标、演示图 ├── 🔌 cli-anything-plugin/ # Claude Code插件 │ ├── HARNESS.md # 方法论SOP(核心文档) │ ├── QUICKSTART.md # 5分钟快速开始 │ ├── PUBLISHING.md # 发布指南 │ ├── repl_skin.py # 统一REPL界面 │ └── commands/ # 插件命令定义 │ ├── cli-anything.md │ ├── refine.md │ ├── test.md │ └── validate.md ├── 🎨 gimp/agent-harness/ ├── 🧊 blender/agent-harness/ ├── ✏️ inkscape/agent-harness/ ├── 🎵 audacity/agent-harness/ ├── 📄 libreoffice/agent-harness/ ├── 📹 obs-studio/agent-harness/ ├── 🎞️ kdenlive/agent-harness/ ├── 🎬 shotcut/agent-harness/ └── 📐 drawio/agent-harness/ 

每个agent-harness/包含:

  • 可安装的Python包(cli_anything.<software>/
  • Click CLI实现
  • 核心模块
  • 工具(含repl_skin.py和后端包装器)
  • 全面测试

八、关键方法论:HARNESS.md

HARNESS.md是项目的标准操作程序(SOP),编码了通过自动化生成流程提炼的成熟模式。

关键经验教训
教训详细说明
使用真实软件CLI必须调用实际应用渲染,不能用Pillow替代GIMP,不能用自定义渲染器替代Blender
渲染差距问题GUI应用在渲染时才应用效果,若CLI操作项目文件但使用简单导出工具,效果会被静默丢弃
滤镜转换MLT→ffmpeg等格式映射时注意:重复滤镜合并、交错流排序、参数空间差异、不可映射效果
时间码精度非整数帧率(29.97fps)导致累积舍入,用round()而非int(),显示用整数运算,测试容差±1帧
输出验证不能因退出码0就信任导出成功,需验证:magic bytes、ZIP/OOXML结构、像素分析、音频RMS电平、时长检查

九、应用场景分类

类别如何Agent化典型示例
📂 GitHub仓库自动CLI生成将任何开源项目转为Agent可控工具VSCodium, WordPress, Calibre, Zotero, Joplin
🤖 AI/ML平台结构化命令自动化模型训练、推理流程、超参调优Stable Diffusion, ComfyUI, InvokeAI, Fooocus
📊 数据分析程序化数据处理、可视化、统计分析工作流JupyterLab, Superset, Metabase, DBeaver
💻 开发工具命令接口简化代码编辑、构建、测试、部署Jenkins, Gitea, Portainer, SonarQube
🎨 创意媒体程序化控制内容创作、编辑、渲染工作流Blender, GIMP, OBS, Krita, Kdenlive
🔬 科学计算自动化研究工作流、仿真、复杂计算ImageJ, FreeCAD, QGIS, ParaView, KiCad
🏢 企业办公将业务应用和生产力工具转为Agent可访问系统NextCloud, GitLab, Grafana, LibreOffice, ERPNext
📐 图表可视化程序化创建和操作图表、流程图、架构图Draw.io, Mermaid, PlantUML, Excalidraw
✨ AI内容生成通过AI云API生成专业交付物(幻灯片、文档、图表)AnyGen, Gamma, Beautiful.ai, Tome

十、愿景与路线图

10.1 核心愿景
  • 🌐 通用访问 — 每个软件都通过结构化CLI即时Agent可控
  • 🔗 无缝集成 — Agent无需API、GUI、重建或复杂包装器即可控制任何应用
  • 🚀 未来就绪生态 — 一条命令将人类设计的软件转为Agent原生工具
10.2 路线图
  • 支持更多应用类别(CAD、DAW、IDE、EDA、科学工具)
  • Agent任务完成率基准测试套件
  • 社区贡献的内部/定制软件CLI
  • 与Claude Code之外的更多Agent框架集成
  • 支持将闭源软件和Web服务的API打包为CLI
  • 生成SKILL.md供Agent技能发现和编排

十一、核心洞察总结

  1. CLI是Agent时代的通用语言 — 不是替代GUI,而是为Agent提供结构化接口
  2. 真实软件调用是关键 — 生成有效项目文件→调用真实后端,拒绝玩具实现
  3. 测试即文档 — 1,436个测试不仅是质量保证,更是功能规格说明
  4. 方法论可复现 — HARNESS.md将经验编码为可执行的标准
  5. 插件化降低门槛 — 通过Claude Code插件市场实现一键CLI生成

Read more

蓝耘MaaS驱动PandaWiki:零基础搭建AI智能知识库完整指南

蓝耘MaaS驱动PandaWiki:零基础搭建AI智能知识库完整指南

此教程使用的环境是:Ubuntu Server 22.04 LTS 64位 2核心4G内存的Linux服务器。 文章摘要: 本文详细介绍了如何使用蓝耘MaaS平台驱动PandaWiki搭建AI智能知识库系统的完整流程。PandaWiki是一款基于AI大模型的开源知识库系统,具备AI创作、AI问答、AI搜索等强大功能。 教程从零开始,首先指导用户注册蓝耘MaaS平台并获取API密钥和模型名称,然后通过一键脚本在Ubuntu Server 22.04环境下快速部署PandaWiki。重点介绍了如何配置蓝耘MaaS平台的DeepSeek-v3.1-Terminus模型,实现高性价比的AI能力支持。 文章通过实战演示,展示了将ZEEKLOG博客批量导入知识库的完整过程,包括Markdown文件上传、数据拉取、批量发布等操作步骤。最终测试验证了AI问答功能的实际效果,系统能够准确理解用户问题并从知识库中检索相关内容提供智能回答。 整个部署过程简单高效,适合企业和个人快速构建智能化的文档管理和知识问答系统,为用户提供了一个低成本、高性能的AI知识库解决方案。 文章目录 * 前言 *

一人手搓!AI 漫剧从0到1详细教程

一人手搓!AI 漫剧从0到1详细教程

这是苍何的第 457 篇原创! 大家好,我是喜欢看动漫的苍何。 相信不用说你也知道,我这万年没变的头像,能看出我是个二次元吧? 最近看到 AI 漫剧超级火,加上前些天朋友来公司,我们一起探讨了 AI 漫剧。 不懂没关系,可以学习啊,所以这一篇文章其实理论上是我学习的一些成果和一些经验,算是从 0 入门如何制作 AI 漫剧了。 现在的 AI 漫剧市场,说白了就是野蛮生长的爆发期。但这个阶段很快就会过去,作品积累到一定量级后,拼的就不是谁做得快了。 未来的逻辑很简单:只有精品才能跑出来。谁能沉下心做品质,谁才能真正搞定客户。 奔着这个目标,下面这个视频是我这个学习阶段的产物,哈哈哈,我觉得还是挺不错的。 然后还做了一个带穿越的视频: 第一个作为AI漫剧的学习作品,我还是非常满意的。 但其实,要想完成这样一个AI漫剧作品,需要用到AI生图、AI视频能力,需要有一个好的工具丝滑完成。 于是开始翻各家AI工具官网,发现有家AI厂商接入了🍌Pro模型。 看了下是国内AI六小龙之一MiniMax旗下的海螺AI,

字节跳动DeerFlow 2.0震撼开源:46k+ Star的超级智能体框架,让AI真正“动手做事“

字节跳动DeerFlow 2.0震撼开源:46k+ Star的超级智能体框架,让AI真正“动手做事“

你是否想过:如果AI不仅能回答问题,还能像真正的助手一样,主动搜索、分析数据、生成报告,甚至制作播客,那会是怎样的体验? 2026年3月,字节跳动开源的DeerFlow 2.0给出了答案。这个项目在GitHub上迅速斩获46,333+ Star,今日新增3,787 stars,登顶Trending榜首。它不是又一个聊天机器人,而是一个能真正"动手做事"的超级智能体框架。 本文将从开发者视角,深入剖析DeerFlow的技术架构、核心能力、部署方法和实战应用,带你全面了解这个革命性的开源项目。 一、DeerFlow是什么?重新定义AI研究助手 1.1 从研究工具到超级智能体的进化 DeerFlow的名字源于Deep Exploration and Efficient Research Flow(深度探索与高效研究流程)。最初,它只是一个深度研究框架,但开发者在实际使用中发现,它的潜力远不止于此: * 有人用它构建数据管道 * 有人用它生成幻灯片和仪表盘 * 有人用它自动化内容工作流

[AI提效-18]-豆包AI绘图提示词全攻略(新手可直接套用)

豆包AI绘图的核心的是“精准提示词=理想图片”,很多新手出图翻车,不是功能不好用,而是没理清提示词的核心维度,不知道每个维度该怎么描述、对应什么效果。本文将逐一拆解画风、画质、主题内容、环境、场景、色彩、灯光要求、构图、角度、图片比例10大核心要素,每个要素配“含义+示例+提示词模板”,结合完整案例详解,新手看完就能直接上手,再也不用瞎猜描述。 核心原则:提示词不用长,但要“每个维度都落地”,避免模糊表述(如“好看的图”“漂亮的风景”),用具体关键词替代,让AI精准get你的需求。 一、核心提示词维度详解(含示例+模板) 1. 画风(决定图片的“整体风格调性”,最基础也最关键) 含义:指图片的艺术风格、绘画/拍摄流派,直接决定图片的视觉质感,是提示词的“