找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4100

积分

0

好友

561

主题
发表于 5 小时前 | 查看: 5| 回复: 0

“一个革命性的浏览器自动化工具,它彻底颠覆了传统 AI Agent 访问互联网的方式。不同于 Playwright、Selenium 等无头浏览器方案,也不同于需要逆向工程的爬虫库,bb-browser 让 AI Agent 直接使用用户真实 Chrome 浏览器的登录态,通过浏览器扩展在页面内执行 JavaScript、调用 fetch、甚至注入 webpack 模块。网站无法区分这是机器还是真人——因为本质上就是用户在操作。这一设计消除了 API 密钥、反爬对抗、复杂鉴权等所有传统痛点,让 AI Agent 能够瞬间访问 Twitter、知乎、B站、GitHub 等 36 个平台的 103 个功能,将‘整个互联网’纳入 Agent 的可调用范围。”

项目地址: https://github.com/epiral/bb-browser

bb-browser 搜索命令示例与中文场景对照

功能特性

核心能力

bb-browser 的精髓在于“身份借用”。当你已经登录微博、知乎、小红书、LinkedIn 等平台后,AI Agent 无需重新认证,即可直接调用这些平台的完整功能。

这种架构带来了三重突破:

  • 不可检测性:网站看到的只是普通用户的正常浏览行为。
  • 功能完整性:可以访问那些没有开放 API、或 API 功能残缺的平台。
  • 即时可用性:跳过繁琐的 OAuth 流程,真正做到开箱即用。

平台覆盖

项目通过社区驱动的 bb-sites 仓库维护适配器,目前已支持 36 个主流平台,总计提供 103 个可调用接口。

  • 搜索引擎:Google、百度、Bing、搜狗微信搜索。
  • 社交媒体:Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑。
  • 新闻资讯:BBC、Reuters、36氪、今日头条、东方财富。
  • 技术开发:GitHub、StackOverflow、HackerNews、CSDN、V2EX、Dev.to、npm、PyPI、arXiv。
  • 视频平台:YouTube、B 站。
  • 垂直领域:豆瓣、IMDb、雪球、BOSS直聘、Wikipedia、携程等。

双重身份

bb-browser 并非单纯的“API 包装器”,它同时是一套完整的浏览器自动化工具。除了高层级的站点命令,还支持底层原子操作,形成从高层语义到底层控制的完整光谱。

高层命令示例

bb-browser site zhihu/hot

底层原子操作

  • open:打开指定页面。
  • snapshot:获取可访问性树。
  • clickfill:模拟点击与输入。
  • eval:执行任意 JavaScript。
  • fetch:发起带登录态的网络请求。
  • network:抓包分析。
  • screenshot:页面截图。

所有命令均支持 --json 结构化输出、--jq 内联过滤、--tab 多标签并发,非常适合集成到自动化流程中。

极速扩展

项目内置 bb-browser guide 完整教程,配合 AI Agent 可实现“一句话逆向”。开发者只需指示 Agent “帮我把 XX 网站 CLI 化”,系统便会自动抓包分析、编写适配器、测试验证。

根据认证复杂度分为三个层级:

  1. Tier 1 (约1分钟):Cookie 直接 fetch,如 Reddit、GitHub。
  2. Tier 2 (约3分钟):Bearer + CSRF 组合,如 Twitter、知乎。
  3. Tier 3 (约10分钟):Webpack 注入或 Pinia store 操作,如 Twitter 高级搜索、小红书。

实测表明,20 个 AI Agent 并发运行,可在同一时段内各自独立完成不同网站的逆向适配,边际成本趋近于零。这个过程本身也形成了一个有趣的 开源实战 研究案例。

部署方式与使用方式

安装启动

全局安装仅需一行命令:

npm install -g bb-browser

安装后,首先更新社区适配器并查看推荐,即可开始使用:

bb-browser site update        # 拉取最新适配器
bb-browser site recommend     # 匹配你的浏览习惯
bb-browser site zhihu/hot     # 获取知乎热榜

三种运行模式

1. OpenClaw 模式 (推荐,零配置)

若使用 OpenClaw 平台,bb-browser 可直接调用其内置浏览器,无需安装任何 Chrome 扩展或守护进程:

bb-browser site reddit/hot --openclaw
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'

对应 Skill 已上架 ClawHub:bb-browser-openclaw

2. Chrome 扩展模式 (独立 CLI)

不依赖 OpenClaw 时,需手动安装浏览器扩展:

  1. 从 GitHub Releases 下载 zip 包。
  2. 解压后,在 chrome://extensions/ 开启开发者模式。
  3. 点击“加载已解压的扩展程序”,选择解压的文件夹。

3. MCP 接入模式 (Claude Code / Cursor)

作为 MCP Server 接入主流 AI 编程工具,配置如下 (例如在 Cursor 的 mcp.json 中):

{
  "mcpServers": {
    "bb-browser": {
      "command": "npx",
      "args": ["-y", "bb-browser", "--mcp"]
    }
  }
}

守护进程配置

bb-browser 默认在 localhost:19824 启动守护进程,可通过 --host 灵活调整:

bb-browser daemon --host 127.0.0.1    # 强制 IPv4,解决 macOS IPv6 兼容问题
bb-browser daemon --host 0.0.0.0      # 监听所有网卡,支持 Tailscale / ZeroTier 跨机器访问

典型工作流示例

当进行跨平台调研时,AI Agent 可以在几分钟内聚合多个维度的信息:

# 学术维度
bb-browser site arxiv/search "retrieval augmented generation"
# 社交讨论维度
bb-browser site twitter/search "RAG"
# 开源实现维度
bb-browser site github search rag-framework
# 技术问答维度
bb-browser site stackoverflow/search "RAG implementation"
# 中文社区维度
bb-browser site zhihu/search "RAG"
# 产业动态维度
bb-browser site 36kr/newsflash

所有输出均为结构化 JSON,可直接进入下游分析流水线。配合 --jq 过滤,可精准提取所需字段,例如 bb-browser site xueqiu/hot-stock 5 --jq ‘.items[] | {name, changePercent}’ 仅返回股票名称与涨跌幅。

总的来说,bb-browser 通过巧妙的架构设计,为 AI Agent 与真实网站交互提供了一条“捷径”。它既是一个强大的生产力工具,其实现思路也为浏览器自动化领域提供了新的视角。对于开发者而言,深入了解其技术文档和基于 Node.js 的插件生态,能帮助我们更好地定制和扩展其能力。如果你对这类前沿工具和开发实践感兴趣,欢迎到云栈社区参与更多讨论。




上一篇:Microsoft Intune 自动化部署实战:从运维痛点到月入6万美元的SaaS产品
下一篇:PageSpeed可访问性检测:利用AI解决网页颜色对比度不足问题
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-17 08:32 , Processed in 0.609387 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表