找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2442

积分

0

好友

343

主题
发表于 10 小时前 | 查看: 0| 回复: 0

国际象棋大师加里·卡斯帕罗夫曾提出过“半人马”概念。他认为,最强的棋手并非顶尖的人类,也非顶尖的AI。

最强的棋手是“人类 + AI + 优秀的协作流程”。人类负责战略和直觉,AI负责计算和战术。

描绘“半人马”协作概念的宇宙神祇插画

然而,在追求自动化,尤其是数据抓取方面,我们有时会过于执着。例如,编写爬虫程序时,为了实现全自动,常常需要破解接口算法、应对反爬机制、模拟登录等等。

但现实往往是,程序今天运行顺畅,明天目标网站稍作调整,整个流程就可能崩溃。

仔细审视我们的实际需求,许多场景并不需要一台全自动的机器,而只需要一只高效的“半人马”——即人机协同的工作模式。尤其是在当下,各类手机、电脑、浏览器Agent层出不穷。

今天介绍的项目正是一个典型的浏览器Agent:一个浏览器插件结合一个大语言模型。模型通过MCP(模型上下文协议)调用插件,来完成模拟浏览器的操作。

这个名为Playwriter的项目在GitHub上已获得超过2.2K星标,是一个值得关注的开源实战项目。

Playwriter项目在GitHub仓库的主页截图

它创造了一种“人类引导,AI执行”的新工作流。这种模式巧妙地解决了使用纯代码或某些自动化工具时常遇到的问题:

  1. 验证难题:让AI独立处理滑块验证码成功率极低。使用Playwriter,你只需手动通过验证环节,剩下的任务可以交给AI。
  2. 职责分明:AI负责思考和规划,Playwriter则借助“视觉无障碍标签”等技术,充当AI在浏览器中的“眼睛”和“手”。
  3. 低门槛:你无需编写代码(当然它也支持代码控制),只需用自然语言清晰地描述需求即可。

如何使用

首先,前往Chrome应用商店下载 Playwriter MCP 扩展程序。

下载地址:https://chromewebstore.google.com/detail/playwriter-mcp/jfeammnjpkecdekppnclgkkffahnhfhe

Playwriter MCP扩展在Chrome商店的展示页面

下载完成后,在浏览器中将其固定到工具栏以便快速访问。

浏览器扩展管理页面,突出显示已安装的Playwriter MCP扩展

接下来是配置MCP服务器。你可以在任何支持MCP协议的终端、大模型客户端、IDE或Agent框架中添加以下配置:

{
  "mcpServers": {
    "playwriter": {
      "command": "npx",
      "args": ["-y", "playwriter@latest"]
    }
  }
}

例如,在Antigravity等客户端中配置后,即可让人工智能模型获得控制浏览器的能力。

Antigravity客户端的MCP服务器配置界面截图

抓取小红书数据实战

下面以小红书网页版为例进行演示。

打开小红书网站,当页面加载完成后,浏览器工具栏中的Playwriter插件图标会变为绿色,这表示它已准备就绪,可以接受指令。

小红书网站搜索“莫言”用户后的个人主页界面

随后,向你的AI助手(已配置好Playwriter MCP)输入提示词。例如:“这是莫言的小红书账号,帮我获取所有笔记的标题、发布时间、点赞数和题图信息。”

AI任务执行界面,显示抓取莫言小红书笔记的提示词和任务规划

发出指令后稍等片刻,你会看到浏览器页面开始自动滚动、点击,这意味着AI正在按照计划执行抓取任务。这种结合人类意图与智能 & 数据自动化执行的方式,极大地简化了数据采集流程。

最终,所有目标数据都被完整地抓取并保存下来。

抓取结果示例,显示莫言小红书笔记的JSON格式数据

我们不应期待AI能独立完成所有事情。对于大多数人、大多数场景而言,实现高效的“半自动化”就已足够。真正的效率提升源于良好的协作,最好的工具不是为了替代人类,而是为了拓展我们的能力边界。

希望这篇关于Playwriter MCP的实践分享能为你带来启发。如果你想了解更多开发者工具与协作心得,欢迎在云栈社区交流探讨。




上一篇:OpenFeign首次调用性能优化:从3秒到100毫秒的实战调优指南
下一篇:医疗数据泄露事件:近60万患者信息遭窃,机构赔偿超1500万元
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-18 16:28 , Processed in 0.218808 second(s), 43 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表