找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2221

积分

0

好友

291

主题
发表于 1 小时前 | 查看: 2| 回复: 0

今天介绍一个名为 Ghost-OS 的开源项目,它正将AI从“聊天机器人”转变为能直接操作你Mac桌面的“数字分身”。

传统AI工具,例如Anthropic的Computer Use,往往依赖于截图来分析屏幕内容并猜测交互位置。这种方式不仅速度慢,精度也有限。而Ghost-OS则采用了更底层、更直接的方法,彻底告别了“看图猜位置”的时代。

核心原理:直接与系统对话

Ghost-OS的核心优势在于其独特的工作原理,它并非通过视觉“猜测”,而是直接读取系统提供的结构化信息。

其主要特点包括:

  1. 利用Accessibility Tree(辅助功能树):macOS系统本身为辅助功能提供了一棵完整的“UI结构树”,其中包含了所有界面元素的层级、位置、名称和状态。Ghost-OS直接读取这棵树,让AI能够像拥有了“X光眼”一样,精准识别每一个按钮、输入框和菜单。只有在处理网页中复杂的视觉内容时,才会调用本地小视觉模型(如ShowUI-2B)辅助理解。这种方式速度快、精度高,且节省token。

  2. 自学习的Recipe工作流引擎:你可以手动操作一次复杂的任务流程(例如:发送一封特定格式的邮件),Ghost-OS能够自动将其记录成一个结构化的JSON“配方”(Recipes)。之后,你只需要用自然语言下达指令,例如:“Send an email to bob about the Q4 report”,AI就能调用这个Recipe一键自动执行,并且支持参数化,灵活又高效。所有的Recipes都可以查看、编辑和分享,过程透明可控。

  3. 本地运行,保障安全与速度:所有处理过程都在你的Mac本地完成,无需将任何屏幕信息或操作数据上传至云端,在保护隐私的同时也获得了更快的响应速度。

  4. 强大的工具集(29个工具):Ghost-OS通过MCP协议提供了丰富的感知与操作工具。

    • 感知类ghost_find(查找元素)、ghost_read(读取文字)、ghost_context(获取当前窗口全貌)等。
    • 操作类ghost_click(点击)、ghost_type(输入)、ghost_scroll(滚动)、ghost_hotkey(快捷键)、ghost_drag(拖拽)等。
    • 流程控制类ghost_wait(等待页面加载)、ghost_run(运行Recipe)等。

安装与配置:简单两步

安装过程非常简洁,通过Homebrew即可完成。

brew install ghostwright/ghost-os/ghost-os
ghost setup

ghost setup 命令会自动引导你完成必要的系统权限配置(如辅助功能权限)、MCP服务器设置以及初始Recipe的安装。

Ghost-OS GitHub项目页面与macOS系统权限配置流程

实战演示:跨应用自动化

Ghost-OS的强大之处在于它能操作任何macOS原生应用,而不仅仅是浏览器。例如,它可以连贯地执行以下任务:

  1. 在Slack中向指定频道发送一条趣味公告。
  2. 在Finder中于桌面创建一个名为“ghost-os-demo”的文件夹。
  3. 返回终端,并总结刚才执行的所有操作。

Claude Code使用Ghost-OS执行Slack发消息和Finder创建文件夹的自动化流程

这一切都通过调用预定义的或自学习的Recipes完成,无需人工干预点击。

生态对比:Ghost-OS 与 OpenClaw Skills

当前,OpenClaw 作为热门的MCP AI助手生态,其“Skills”(技能包)提供了丰富的功能扩展。但相比之下,Ghost-OS在Mac桌面自动化领域定位更为专精:

  • OpenClaw Skills:大多基于浏览器DOM操作或命令行脚本,部分仍依赖截图识别。对于Slack、Finder等原生应用的控制能力较弱,且缺乏流程的自学习与记录能力。
  • Ghost-OS:专为macOS原生GUI自动化设计,底层采用AX树+本地视觉模型,精准度高。内置Recipe自学习引擎,一次配置永久使用。完全本地化运行,安全性更高。更重要的是,它可以与OpenClaw完美集成,作为其强大的工具源。

简而言之,OpenClaw Skills像是“浏览器专家”,而Ghost-OS则是“全Mac桌面专家”。两者结合能让你的AI助手能力获得质的飞跃。

如何集成到你的MCP工作流

Ghost-OS本身就是一个 MCP(Model Context Protocol)服务器,可以轻松集成到任何支持MCP的客户端中:

  • Claude Code / Claude Desktop
  • Cursor
  • VS Code
  • OpenClaw(重点推荐)

安装配置好Ghost-OS后,你只需在OpenClaw中添加Ghost-OS作为工具源,你的OpenClaw Agent就能直接调用其全部的29个ghost_xxx工具。这意味着你的智能体同时具备了浏览器操作和整个系统桌面操控的能力。

对于OpenClaw用户来说,安装Ghost-OS是直接将Skills能力升级到“全系统控制”级别的关键一步。

结语

Ghost-OS的出现,标志着AI智能体从“只能动口”向“可以动手”迈出了坚实的一步。它让普通Mac用户也能轻松打造属于自己的“数字员工”,自动化处理日常重复性任务,极大提升生产力。

如果你对这类能彻底改变人机交互方式的开源项目或人工智能前沿应用感兴趣,欢迎在云栈社区交流讨论,分享你的自动化使用心得。




上一篇:乙方软件公司,在AI让写代码近乎免费的当下如何生存?
下一篇:苹果宣布调整中国区App Store佣金率,iPhone Fold量产备货冲刺
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-14 08:25 , Processed in 0.507172 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表