找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2351

积分

0

好友

311

主题
发表于 4 小时前 | 查看: 2| 回复: 0

Chrome 146 版本悄然上线了一项重要更新——原生集成 MCP(Model Context Protocol)支持。这看似微小的改动,却可能重塑众多 AI Agent 与浏览器交互的工作范式。

过去,若想让 AI 操作浏览器,通常只有两种选择:启用 headless(无界面)模式,或者费尽心思迁移登录状态。无论哪种方式,体验都称不上优雅。headless 模式容易被网站检测并屏蔽,而移植登录态则需折腾 Cookie、token 等凭据,过程繁琐。甚至有人为此专门安装中继插件来桥接浏览器能力,但稳定性往往不尽如人意。

现在,情况发生了转变。Chrome 146 现已原生支持 MCP。你只需在浏览器地址栏输入 chrome://inspect,找到并开启“Remote debugging”开关(具体路径为 chrome://inspect/#remote-debugging),你的 AI Agent 便能直接连接到当前正在运行的浏览器会话进行控制。请注意,这里连接的是你手头正在使用的真实会话,而非新建一个独立实例。

开发者 Petr Baudis 演示了一个生动用例:他让 Claude AI 助手帮忙清理 LinkedIn 上那些充斥推销内容的连接请求。Claude 自动打开了他的 LinkedIn 页面,逐一分析每个邀请,随后批量执行了“忽略”操作。整个过程完全复用 Petr 已经登录的浏览器会话,无需任何额外的身份认证步骤。

终端读取 Chrome CDP 技能文件界面

执行 LinkedIn 邀请拒绝自动化脚本的终端输出

这项更新意味着什么?以下几点变化值得关注:

  1. 无需重新登录。你日常使用的网站登录状态可以直接被 Agent 复用,省去了复杂的凭据管理。
  2. 规避指纹检测。由于操作的是真实的用户浏览器,而非典型的自动化工具(如 Puppeteer),因此大大降低了被网站反爬机制识别和拦截的风险。
  3. 拓展自动化场景。以往难以实现的自动化任务,例如自动填写复杂表单、处理政务网站流程、或测试需要特定会话状态的 Web 应用,现在门槛都显著降低。

当然,能力越强,责任越大。也有开发者提醒,最大的挑战在于控制权与安全边界。让 Agent 直接操作真实的浏览器会话,必须建立清晰的权限管控机制和操作审计日志,否则可能引入潜在的安全风险。

目前,官方的 Chrome MCP 客户端在处理数百个标签页时可能还不稳定。为此,Petr Baudis 编写了一个优化技能(skill)来提升体验:chrome-cdp-skill。安装方式非常简单,只需一行命令:

npx skills add https://github.com/pasky/chrome-cdp-skill

或者,你也可以直接在 chrome://inspect 界面中开启调试开关来使用。据悉,OpenClaw 等项目也将在新版本中集成此能力,未来执行浏览器操作任务的 Token 消耗量有望大幅下降。

浏览器操作是 LLM(大语言模型)最关键的能力之一。Chrome 此次开放原生集成,无疑为许多现有的自动化工作流带来了福音。对于开发者而言,这意味着更高效、更真实的 Web 应用 测试与交互方式成为可能。想了解更多关于前沿技术趋势和实战讨论,欢迎访问云栈社区




上一篇:OpenClaw技能别乱装!亲测半月只留这6个,效率安全双提升
下一篇:OpenClaw 企业化之路:从个人效率工具到可信平台还有多远?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-15 06:58 , Processed in 0.550717 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表