当前的 AI Agent 在代码生成和任务规划方面已相当强大,但一旦需要操控真实世界的专业软件,就常常显得力不从心。传统的做法要么依赖脆弱的 UI 自动化(比如截图、模拟点击),不仅易出错,软件版本一变就容易崩溃;要么只能等待软件官方提供 API,而 API 往往覆盖不全,使用起来也颇为复杂。
最近在 GitHub 上发现了一个极具启发性的开源项目 —— CLI-Anything。它提供了一种全新的解决思路:让 AI 不再去“笨拙地操作图形界面”,而是能直接“调用软件的原生能力”。

项目简介
CLI-Anything 由香港大学数据科学实验室推出,其核心思想直接且高效:使用 CLI(命令行界面)作为 AI Agent 与真实软件之间的“翻译官”和“桥梁”。

它并非一个简单的命令包装器,而是一套全自动的“软件能力翻译机”。你只需将目标软件的源代码路径或其 GitHub 仓库地址提供给它,它就会启动一个包含 7 个阶段的自动化流水线。这条流水线会自动分析源码结构、设计 CLI 架构、实现具体命令、编写完整测试套件、并最终打包发布,生成一个可直接用于生产的 Python CLI 工具包。

最关键的是,生成的 CLI 命令能够直接调用软件的真实后端引擎(例如 LibreOffice 的无头模式、Blender 的 bpy Python 脚本接口),从而生成真实的 PDF 文件、渲染真实的 3D 场景,而非模拟鼠标点击的“障眼法”。该项目在 GitHub 上开源不到半个月,就迅速获得了 超过 23k 的 Star,热度可见一斑。

功能特性
- 一键全自动生成:内置 7 阶段自动化流水线,从源码分析到测试发布全程无需人工干预。
- 对接真实后端:生成的接口直接调用软件原生渲染与处理能力,输出结果与手动操作完全一致。
- 稳定可靠:基于纯命令行交互,彻底抛弃脆弱的截图点击式 RPA,不受图形界面版本变化影响。
- 双模式支持:同时支持 REPL 交互式会话模式与脚本子命令模式,完美适配AI Agent的对话流程与自动化流水线。
- 结构化输出:内置
--json 参数选项,所有命令结果均可输出为结构化 JSON,方便 AI 解析结果并做出下一步决策。
- 经过生产验证:已覆盖 GIMP、Blender、LibreOffice 等多款主流专业软件,所有生成的测试用例 100% 通过。
快速安装与使用
环境要求
- Python 3.10 或更高版本
- 目标软件已安装(如 GIMP、Blender、LibreOffice)
- Claude Code(支持插件运行)
插件安装
# 添加插件市场
/plugin marketplace add HKUDS/CLI-Anything
# 安装插件
/plugin install cli-anything
一键生成 CLI
# 为本地GIMP源码生成CLI
/cli-anything:cli-anything ./gimp
# 从GitHub仓库生成(如Blender)
/cli-anything:cli-anything https://github.com/blender/blender
命令执行后,Agent 会自动运行 7 阶段流水线。最终,CLI 的完整代码将生成在 ./gimp/agent-harness 目录中。
安装并使用生成的 CLI
cd gimp/agent-harness && pip install -e .
# 使用CLI创建新项目
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json
# 进入交互式REPL模式
cli-anything-gimp
例如,使用生成的 LibreOffice CLI 自动创建一份季度报告:
# 1. 创建一个新的Writer文档
cli-anything-libreoffice document new -o report.json --type writer
# 2. 为文档添加一级标题
cli-anything-libreoffice --project report.json writer add-heading -t "Q1 Report" --level 1
# 3. 添加一个4行3列的表格
cli-anything-libreoffice --project report.json writer add-table --rows 4 --cols 3
# 4. 调用LibreOffice无头模式导出为真实的PDF文件
cli-anything-libreoffice --project report.json export render output.pdf -p pdf --overwrite
整个过程无需打开任何 GUI 界面。AI Agent 通过解析上一步命令输出的 JSON 状态,即可决定并执行下一步操作,实现完全的自动化工作流。
测试覆盖与可靠性
项目对生成的 CLI 进行了严格的测试。以下为部分已支持软件的测试数据概览:

局限性与思考
当然,CLI-Anything 虽然惊艳,但在实际落地应用中,仍有几点需要理性看待:
- 依赖源码质量:生成 CLI 的质量与原项目的代码结构和清晰度直接相关。若原项目结构混乱,生成的 CLI 可读性和易用性可能会打折扣。
- 不适用于闭源软件:该方法必须基于可获取的源代码,因此无法直接作用于大量的商业闭源软件或 SaaS 服务。
- “能用”不等于“好用”:虽然理论上可以覆盖软件的全部功能,但自动生成的命令设计未必最优雅或符合直觉,AI 在调用时可能仍需进行一定的适配和优化。
- 生态处于早期:作为新兴项目,其最佳实践、与现有 CI/CD 工具链的集成、以及社区贡献的经验都还在逐步积累和完善中。
小结
CLI-Anything 重新定义了 AI 与专业软件之间的交互范式。它能够将原本为人类设计的 GUI 软件,快速改造为“Agent-Native”(智能体原生)的工具,从而让 OpenClaw、Claude Code 等 Agent 框架真正获得操控复杂专业软件的能力。
随着社区在开源实战中不断贡献和完善,相信未来它会支持更多软件与框架,非常有可能成为 Agent 时代一项不可或缺的基础设施工具。
如果你对更多技术细节和实现原理感兴趣,可以访问项目地址查看:
https://github.com/HKUDS/CLI-Anything
技术革新的浪潮总是由这些充满想象力的工具推动。在云栈社区,我们持续关注并分享此类前沿开源动态,欢迎开发者们一同探讨技术未来的更多可能。