香港大学出手了:一行命令,让所有软件都能被 AI 控制

开源一周狂揽 1.6 万星,这个项目要做”软件界的 USB 接口”


导语

你有没有过这种经历:

对着 GIMP 发呆,不知道从哪下手;Blender 的几百个按钮看得头晕;想用 LibreOffice 合并几个表格,折腾半天还没搞定。

然后你看着 AI 帮你写代码、写文章、写PPT,心里想:要是它也能帮我操作这些软件就好了。

刚刚,这个愿望成真了。

香港大学数据科学学院开源了一个叫 CLI-Anything 的项目。简单说:一行命令,把任何软件变成 AI 能用的工具。

开源才一周,GitHub 上已经 1.6 万颗星1。有人在评论区说:这是”软件界的 USB 接口”——一旦插上,任何软件都能被 AI 驱动2


01 它到底做了什么?

说人话:把”点点点”的图形软件,变成 AI 能听懂的”命令行”。

为什么非要是命令行?因为 AI 大模型本质上是个”文字处理器”——给它文本,它吐文本。图形界面的那些按钮、菜单、窗口,AI 看着就像盲人摸象。

但命令行不一样,全是文字,AI 直接就能理解。

项目团队在 README 里写了一句很燃的话3

今天的软件为人而生,明天的用户是 Agent

这句话点破了一个现实:我们有成千上万款专业软件,但 AI 一个都用不了。CLI-Anything 就是在填这个坑。


02 为什么是 CLI?

图:CLI-Anything 架构 — 让所有软件都能被 Agent 驱动

你可能会问:为什么非要是命令行?项目给出了 6 个理由4

特性为什么对 AI 重要
结构化、可组合文本命令天然匹配 LLM 输入格式,可串联成复杂工作流
轻量且通用零开销,跨平台运行,不依赖额外环境
自描述一个 --help 就能让 AI 自动发现所有功能
久经验证Claude Code 每天通过 CLI 执行数千个真实任务
Agent 友好结构化 JSON 输出,AI 无需额外解析
确定且可靠输出稳定一致,AI 行为可预测

简单说:CLI 是人类和 AI 都能听懂的”普通话”。


03 一行命令,5 分钟搞定

图:CLI-Anything 的 7 个自动化阶段

CLI-Anything 的使用简单得令人发指:

# 为 GIMP 生成完整的 CLI
/cli-anything:cli-anything ./gimp

这一行命令背后,自动完成了 7 个阶段5

  1. 分析 — 扫描源码,将 GUI 操作映射到 API
  2. 设计 — 规划命令分组、状态模型、输出格式
  3. 实现 — 构建 Click CLI,包含 REPL、JSON 输出、撤销/重做
  4. 规划测试 — 生成测试计划
  5. 编写测试 — 实现完整测试套件
  6. 文档 — 更新文档,写入测试结果
  7. 发布 — 生成安装包,安装到 PATH

整个过程大概 5 分钟。


04 不是 PPT 产品,是真家伙

很多开源项目是”演示级”的,好看不好用。但 CLI-Anything 不一样:

已支持 13 款专业软件,而且都是硬核工具6

软件领域后端技术
GIMP图像编辑Pillow + GEGL/Script-Fu
Blender3D 建模Python API
LibreOffice办公软件UNO bridge
Inkscape矢量图形CLI + SVG
Audacity音频处理Sox
OBS Studio直播推流obs-websocket-js
Shotcut视频编辑MLT XML
Zoom视频会议Zoom CLI

重点来了:这些不是”阉割版”,是完整功能。你想让 AI 用 Blender 渲染 3D 场景,它调用的就是真正的 Blender 渲染器,不是什么替代品7


05 支持多个 AI 平台

CLI-Anything 不是为某个特定 AI 打造的,而是支持多家平台8

  • Claude Code — 主要支持平台
  • OpenClaw — 社区贡献支持
  • OpenCode — 实验性支持
  • Codex — 社区支持
  • Qodercli — 社区支持

安装也很简单,以 Claude Code 为例:

# 添加插件市场
/plugin marketplace add HKUDS/CLI-Anything

# 安装插件
/plugin install cli-anything

06 为什么这么火?

开源一周,1.6 万星。凭什么?

第一,它打了个真正的痛点

AI 再聪明,面对图形界面也是瞎子。之前也有各种尝试,要么是脆弱的 UI 自动化,要么是有限的 API,要么是重写一个”阉割版”9

CLI-Anything 不一样,它直接把软件”翻译”成 AI 能听懂的语言。

第二,它是”零妥协”方案

用 LibreOffice 生成 PDF?调用的就是真正的 LibreOffice。用 Blender 渲染 3D?调用的就是真正的 Blender 渲染器。没有偷工减料10

第三,它是个”通用钥匙”

理论上,任何有源码或 API 的软件都能被转换。社区已经在讨论浏览器支持了——如果实现,AI 就能像人类一样”浏览”网页11

第四,它在疯狂迭代

看看这个更新速度:

  • 3月16日:新增 SKILL.md 生成功能
  • 3月15日:支持 OpenClaw
  • 3月14日:修复安全漏洞,新增日文文档
  • 3月13日:Qodercli 插件合并
  • 12

每天都在进步,这还是一周前的项目。


07 实战示例

假设你想让 AI 操作 GIMP 做图像处理:

# 生成 GIMP 的 CLI
/cli-anything:cli-anything ./gimp

# 生成后,AI 就可以这样操作
cli-anything-gimp resize input.jpg --width 800 --height 600
cli-anything-gimp filter input.jpg --type gaussian-blur --radius 5
cli-anything-gimp export input.jpg --format png --output output.png

所有操作都会返回结构化的 JSON,AI 可以直接解析和处理结果。


08 局限性

项目还很新,也有一些限制:

  1. 需要软件安装 — 目标软件必须已安装在系统上
  2. Python 3.10+ — 当前只支持较新的 Python 版本
  3. 学习曲线 — 需要一定的命令行知识
  4. Windows 兼容性 — 需要安装 Git for Windows 或使用 WSL

但这些问题随着社区贡献正在快速解决。


常见问题 Q&A

Q: CLI-Anything 是免费的开源项目吗?

A: 是的,采用 MIT 许可证,任何人都可以自由使用、修改和分发13

Q: 我没有任何编程基础,可以用吗?

A: 如果只是使用生成的 CLI,不需要编程基础。但如果要为新的软件生成 CLI,需要一定的技术背景。

Q: 支持中文软件吗?

A: 理论上支持任何软件,与软件语言无关。项目本身已有完整的中文文档14

Q: 能为商业软件生成 CLI 吗?

A: 只要软件有 API 或可逆向工程的接口,理论上都可以。但要注意遵守软件的使用条款。



总结

CLI-Anything 代表了一个不可逆的趋势:软件正在为 AI 重新设计。

想想看,十年前我们用什么?鼠标键盘。五年前呢?触摸屏。今天呢?

明天,我们可能只需要说一句话。

这个项目让这一天来得更快了。


最后说一句:

如果你是个开发者,这个项目值得 Star——不仅因为它的技术实力,更因为它指明了方向。

如果你是个普通用户,不妨关注一下。因为下一次你打开软件时,可能就是 AI 在帮你操作了。


参考资料

[1]  GitHub – HKUDS/CLI-Anything — 项目主页

[2]  README – CLI-Anything Vision — 项目愿景说明

[3]  README_CN – 中文文档 — 中文版 README

[4]  README – Why CLI? — CLI 优势说明

[5]  README – Quick Start — 快速上手指南

[6]  README – Demonstrations — 已支持应用列表

[7]  README – Authentic Software Integration — 真实软件集成说明

[8]  README – Pick Your Platform — 平台支持说明

[9]  README – The Agent-Software Gap — Agent 与软件的鸿沟

[10]  README – Authentic Software Integration — 零妥协集成说明

[11]  Issue #90 – Browser automation — 浏览器自动化讨论

[12]  README – News — 项目更新日志

[13]  GitHub – LICENSE — MIT 许可证

[14]  README_CN – 中文文档 — 完整中文文档