香港大学出手了:一行命令,让所有软件都能被 AI 控制
开源一周狂揽 1.6 万星,这个项目要做”软件界的 USB 接口”
导语

你有没有过这种经历:
对着 GIMP 发呆,不知道从哪下手;Blender 的几百个按钮看得头晕;想用 LibreOffice 合并几个表格,折腾半天还没搞定。
然后你看着 AI 帮你写代码、写文章、写PPT,心里想:要是它也能帮我操作这些软件就好了。
刚刚,这个愿望成真了。
香港大学数据科学学院开源了一个叫 CLI-Anything 的项目。简单说:一行命令,把任何软件变成 AI 能用的工具。
开源才一周,GitHub 上已经 1.6 万颗星1。有人在评论区说:这是”软件界的 USB 接口”——一旦插上,任何软件都能被 AI 驱动2。
01 它到底做了什么?
说人话:把”点点点”的图形软件,变成 AI 能听懂的”命令行”。
为什么非要是命令行?因为 AI 大模型本质上是个”文字处理器”——给它文本,它吐文本。图形界面的那些按钮、菜单、窗口,AI 看着就像盲人摸象。
但命令行不一样,全是文字,AI 直接就能理解。
项目团队在 README 里写了一句很燃的话3:
今天的软件为人而生,明天的用户是 Agent
这句话点破了一个现实:我们有成千上万款专业软件,但 AI 一个都用不了。CLI-Anything 就是在填这个坑。
02 为什么是 CLI?

图:CLI-Anything 架构 — 让所有软件都能被 Agent 驱动
你可能会问:为什么非要是命令行?项目给出了 6 个理由4:
| 特性 | 为什么对 AI 重要 |
|---|---|
| 结构化、可组合 | 文本命令天然匹配 LLM 输入格式,可串联成复杂工作流 |
| 轻量且通用 | 零开销,跨平台运行,不依赖额外环境 |
| 自描述 | 一个 --help 就能让 AI 自动发现所有功能 |
| 久经验证 | Claude Code 每天通过 CLI 执行数千个真实任务 |
| Agent 友好 | 结构化 JSON 输出,AI 无需额外解析 |
| 确定且可靠 | 输出稳定一致,AI 行为可预测 |
简单说:CLI 是人类和 AI 都能听懂的”普通话”。
03 一行命令,5 分钟搞定

图:CLI-Anything 的 7 个自动化阶段
CLI-Anything 的使用简单得令人发指:
# 为 GIMP 生成完整的 CLI
/cli-anything:cli-anything ./gimp
这一行命令背后,自动完成了 7 个阶段5:
- 分析 — 扫描源码,将 GUI 操作映射到 API
- 设计 — 规划命令分组、状态模型、输出格式
- 实现 — 构建 Click CLI,包含 REPL、JSON 输出、撤销/重做
- 规划测试 — 生成测试计划
- 编写测试 — 实现完整测试套件
- 文档 — 更新文档,写入测试结果
- 发布 — 生成安装包,安装到 PATH
整个过程大概 5 分钟。
04 不是 PPT 产品,是真家伙
很多开源项目是”演示级”的,好看不好用。但 CLI-Anything 不一样:
已支持 13 款专业软件,而且都是硬核工具6:
| 软件 | 领域 | 后端技术 |
|---|---|---|
| GIMP | 图像编辑 | Pillow + GEGL/Script-Fu |
| Blender | 3D 建模 | Python API |
| LibreOffice | 办公软件 | UNO bridge |
| Inkscape | 矢量图形 | CLI + SVG |
| Audacity | 音频处理 | Sox |
| OBS Studio | 直播推流 | obs-websocket-js |
| Shotcut | 视频编辑 | MLT XML |
| Zoom | 视频会议 | Zoom CLI |
重点来了:这些不是”阉割版”,是完整功能。你想让 AI 用 Blender 渲染 3D 场景,它调用的就是真正的 Blender 渲染器,不是什么替代品7。
05 支持多个 AI 平台
CLI-Anything 不是为某个特定 AI 打造的,而是支持多家平台8:
- Claude Code — 主要支持平台
- OpenClaw — 社区贡献支持
- OpenCode — 实验性支持
- Codex — 社区支持
- Qodercli — 社区支持
安装也很简单,以 Claude Code 为例:
# 添加插件市场
/plugin marketplace add HKUDS/CLI-Anything
# 安装插件
/plugin install cli-anything
06 为什么这么火?
开源一周,1.6 万星。凭什么?
第一,它打了个真正的痛点
AI 再聪明,面对图形界面也是瞎子。之前也有各种尝试,要么是脆弱的 UI 自动化,要么是有限的 API,要么是重写一个”阉割版”9。
CLI-Anything 不一样,它直接把软件”翻译”成 AI 能听懂的语言。
第二,它是”零妥协”方案
用 LibreOffice 生成 PDF?调用的就是真正的 LibreOffice。用 Blender 渲染 3D?调用的就是真正的 Blender 渲染器。没有偷工减料10。
第三,它是个”通用钥匙”
理论上,任何有源码或 API 的软件都能被转换。社区已经在讨论浏览器支持了——如果实现,AI 就能像人类一样”浏览”网页11。
第四,它在疯狂迭代
看看这个更新速度:
- 3月16日:新增 SKILL.md 生成功能
- 3月15日:支持 OpenClaw
- 3月14日:修复安全漏洞,新增日文文档
- 3月13日:Qodercli 插件合并
- …12
每天都在进步,这还是一周前的项目。
07 实战示例
假设你想让 AI 操作 GIMP 做图像处理:
# 生成 GIMP 的 CLI
/cli-anything:cli-anything ./gimp
# 生成后,AI 就可以这样操作
cli-anything-gimp resize input.jpg --width 800 --height 600
cli-anything-gimp filter input.jpg --type gaussian-blur --radius 5
cli-anything-gimp export input.jpg --format png --output output.png
所有操作都会返回结构化的 JSON,AI 可以直接解析和处理结果。
08 局限性
项目还很新,也有一些限制:
- 需要软件安装 — 目标软件必须已安装在系统上
- Python 3.10+ — 当前只支持较新的 Python 版本
- 学习曲线 — 需要一定的命令行知识
- Windows 兼容性 — 需要安装 Git for Windows 或使用 WSL
但这些问题随着社区贡献正在快速解决。
常见问题 Q&A
Q: CLI-Anything 是免费的开源项目吗?
A: 是的,采用 MIT 许可证,任何人都可以自由使用、修改和分发13。
Q: 我没有任何编程基础,可以用吗?
A: 如果只是使用生成的 CLI,不需要编程基础。但如果要为新的软件生成 CLI,需要一定的技术背景。
Q: 支持中文软件吗?
A: 理论上支持任何软件,与软件语言无关。项目本身已有完整的中文文档14。
Q: 能为商业软件生成 CLI 吗?
A: 只要软件有 API 或可逆向工程的接口,理论上都可以。但要注意遵守软件的使用条款。
总结
CLI-Anything 代表了一个不可逆的趋势:软件正在为 AI 重新设计。
想想看,十年前我们用什么?鼠标键盘。五年前呢?触摸屏。今天呢?
明天,我们可能只需要说一句话。
这个项目让这一天来得更快了。
最后说一句:
如果你是个开发者,这个项目值得 Star——不仅因为它的技术实力,更因为它指明了方向。
如果你是个普通用户,不妨关注一下。因为下一次你打开软件时,可能就是 AI 在帮你操作了。
参考资料
[1] GitHub – HKUDS/CLI-Anything — 项目主页
[2] README – CLI-Anything Vision — 项目愿景说明
[3] README_CN – 中文文档 — 中文版 README
[4] README – Why CLI? — CLI 优势说明
[5] README – Quick Start — 快速上手指南
[6] README – Demonstrations — 已支持应用列表
[7] README – Authentic Software Integration — 真实软件集成说明
[8] README – Pick Your Platform — 平台支持说明
[9] README – The Agent-Software Gap — Agent 与软件的鸿沟
[10] README – Authentic Software Integration — 零妥协集成说明
[11] Issue #90 – Browser automation — 浏览器自动化讨论
[12] README – News — 项目更新日志
[13] GitHub – LICENSE — MIT 许可证
[14] README_CN – 中文文档 — 完整中文文档
