不知道你是否注意到,最近与命令行(CLI)相关的开源项目正变得越来越热门。
为什么会出现这种现象?核心原因在于,命令行能够极大降低 AI 执行实际操作时的不确定性。传统的 AI 任务执行,往往依赖于视觉识别和界面模拟,一旦步骤增多,出错率便会呈指数级增长。然而,对于一个结构明确的命令行指令,大语言模型可以做到精准识别与调用,既快速又准确。
过去,CLI 更多是程序员手动输入命令的专属工具;而现在,只要你将命令行工具安装在诸如“龙虾”或 Claude Code 这类 AI 编码助手的运行环境中,交互模式就彻底改变了:人类只需用自然语言描述需求,AI 则负责将这些模糊的需求“翻译”成一条条具体的命令,并在终端中自动执行。
我们可以将命令行理解为一个 “动作总线” :预先安装好各类工具和脚本,AI 只要掌握了“拼装”命令的能力,就能将这些独立任务串联起来,完成复杂的工作流。相比之下,若要让 AI 在图形界面(GUI)中完成同样的事,它需要理解无数不同应用的界面、按钮和菜单逻辑,其成本与不确定性都要高得多。
近期备受关注的两个开源项目——opencli 与香港大学实验室开源的 CLI-Anything——都印证了这一趋势。前者允许你以命令行的方式访问各大网站(需在本机 Chrome 浏览器安装一个扩展),例如,执行 opencli bilibili feed,即可获取你订阅的 B 站视频动态。CLI-Anything 则致力于将任意开源项目转化为可供 Agent 操控的工具,即生成结构化的命令行接口。
更重要的是,这些命令行工具都可以被各类 AI Agent 工具(如 OpenClaw、Claude Code、Codex 等)轻松调用。
企业级应用也迅速跟进。最近,企业微信和飞书都开源了自己的命令行工具集,能够无缝接入到“龙虾”、Claude Code 等工具中。这使得 AI Bot 能够直接操作通讯录、安排会议、管理待办事项、发送群消息等。
实践示例:安装与使用企微 CLI
下面以企业微信 CLI 为例,演示其安装与集成过程。
安装企微 CLI 核心工具包:
npm install -g @wecom/cli
为 AI Agent 注册企微 CLI 技能:
执行此命令后,npx 会自动查找你机器上所有可用的 AI Agent 并进行技能注册。
npx skills add WeComTeam/wecom-cli -y -g快速开始
完成初始化后,你的“龙虾”、Claude Code(CC)甚至是 Codex 等 Agent,就都能够调用企业微信的功能了。
使用场景 1:创建日程
你可以直接对 AI 说:“帮我在企微里设定一个日程,今天下午 6 点讨论产品需求。” AI 便会精准地理解并执行相应的 CLI 命令来完成此操作。
使用场景 2:多工具联动
如果我们安装了多个 CLI 工具,就能实现更强大的跨应用自动化。例如,对 AI 发出指令:“帮我查一下 B 站上的动态,相关内容和链接保存到企业微信的文档里。”
AI 背后的执行链条可能是:
- 首先调用
opencli bilibili feed --limit 20,获取返回的 B 站动态结果(假设共 17 条)。
- 接着,通过
wecom-cli doc create_doc 命令,将上一步获取的内容和链接写入企业微信文档。
如此,一个完整的跨平台任务链条便自动化完成了。
自 2023 年以来,AI 技术浪潮的演进脉络逐渐清晰:它首先改造了人机对话(自然语言交互),继而改变了编程方式(从智能补全到 Coding Agent),随后通过 AI 浏览器重新激活了 Web 交互。如今,变革的焦点来到了命令行(CLI)。那些曾经专属于开发者的 CLI 工具,正在悄然转变为 AI Agent 高效运转的“工作套件”,在后台默默处理着日益复杂的自动化任务。对这一趋势的深入探讨和实践分享,也欢迎你在云栈社区与更多开发者交流。
|