4137 积分	0 好友	543 主题

发消息

Chrome 146 原生支持 MCP 协议，AI Agent 可直接控制真实浏览器会话

发表于 2026-3-15 02:45:56 | 查看: 110| 回复: 0

Chrome 146 版本悄然上线了一项重要更新——原生集成 MCP（Model Context Protocol）支持。这看似微小的改动，却可能重塑众多 AI Agent 与浏览器交互的工作范式。

过去，若想让 AI 操作浏览器，通常只有两种选择：启用 headless（无界面）模式，或者费尽心思迁移登录状态。无论哪种方式，体验都称不上优雅。headless 模式容易被网站检测并屏蔽，而移植登录态则需折腾 Cookie、token 等凭据，过程繁琐。甚至有人为此专门安装中继插件来桥接浏览器能力，但稳定性往往不尽如人意。

现在，情况发生了转变。Chrome 146 现已原生支持 MCP。你只需在浏览器地址栏输入 chrome://inspect，找到并开启“Remote debugging”开关（具体路径为 chrome://inspect/#remote-debugging），你的 AI Agent 便能直接连接到当前正在运行的浏览器会话进行控制。请注意，这里连接的是你手头正在使用的真实会话，而非新建一个独立实例。

开发者 Petr Baudis 演示了一个生动用例：他让 Claude AI 助手帮忙清理 LinkedIn 上那些充斥推销内容的连接请求。Claude 自动打开了他的 LinkedIn 页面，逐一分析每个邀请，随后批量执行了“忽略”操作。整个过程完全复用 Petr 已经登录的浏览器会话，无需任何额外的身份认证步骤。

终端读取 Chrome CDP 技能文件界面

执行 LinkedIn 邀请拒绝自动化脚本的终端输出

这项更新意味着什么？以下几点变化值得关注：

无需重新登录。你日常使用的网站登录状态可以直接被 Agent 复用，省去了复杂的凭据管理。
规避指纹检测。由于操作的是真实的用户浏览器，而非典型的自动化工具（如 Puppeteer），因此大大降低了被网站反爬机制识别和拦截的风险。
拓展自动化场景。以往难以实现的自动化任务，例如自动填写复杂表单、处理政务网站流程、或测试需要特定会话状态的 Web 应用，现在门槛都显著降低。

当然，能力越强，责任越大。也有开发者提醒，最大的挑战在于控制权与安全边界。让 Agent 直接操作真实的浏览器会话，必须建立清晰的权限管控机制和操作审计日志，否则可能引入潜在的安全风险。

目前，官方的 Chrome MCP 客户端在处理数百个标签页时可能还不稳定。为此，Petr Baudis 编写了一个优化技能（skill）来提升体验：chrome-cdp-skill。安装方式非常简单，只需一行命令：

npx skills add https://github.com/pasky/chrome-cdp-skill

或者，你也可以直接在 chrome://inspect 界面中开启调试开关来使用。据悉，OpenClaw 等项目也将在新版本中集成此能力，未来执行浏览器操作任务的 Token 消耗量有望大幅下降。

浏览器操作是 LLM（大语言模型）最关键的能力之一。Chrome 此次开放原生集成，无疑为许多现有的自动化工作流带来了福音。对于开发者而言，这意味着更高效、更真实的 Web 应用测试与交互方式成为可能。想了解更多关于前沿技术趋势和实战讨论，欢迎访问云栈社区。

上一篇：OpenClaw技能别乱装！亲测半月只留这6个，效率安全双提升
下一篇：OpenClaw 企业化之路：从个人效率工具到可信平台还有多远？

Chrome, MCP, 人工智能代理, 浏览器自动化, CDP

Chrome 146 原生支持 MCP 协议，AI Agent 可直接控制真实浏览器会话

相关帖子