“一个革命性的浏览器自动化工具,它彻底颠覆了传统 AI Agent 访问互联网的方式。不同于 Playwright、Selenium 等无头浏览器方案,也不同于需要逆向工程的爬虫库,bb-browser 让 AI Agent 直接使用用户真实 Chrome 浏览器的登录态,通过浏览器扩展在页面内执行 JavaScript、调用 fetch、甚至注入 webpack 模块。网站无法区分这是机器还是真人——因为本质上就是用户在操作。这一设计消除了 API 密钥、反爬对抗、复杂鉴权等所有传统痛点,让 AI Agent 能够瞬间访问 Twitter、知乎、B站、GitHub 等 36 个平台的 103 个功能,将‘整个互联网’纳入 Agent 的可调用范围。”
项目地址: https://github.com/epiral/bb-browser

功能特性
核心能力
bb-browser 的精髓在于“身份借用”。当你已经登录微博、知乎、小红书、LinkedIn 等平台后,AI Agent 无需重新认证,即可直接调用这些平台的完整功能。
这种架构带来了三重突破:
- 不可检测性:网站看到的只是普通用户的正常浏览行为。
- 功能完整性:可以访问那些没有开放 API、或 API 功能残缺的平台。
- 即时可用性:跳过繁琐的 OAuth 流程,真正做到开箱即用。
平台覆盖
项目通过社区驱动的 bb-sites 仓库维护适配器,目前已支持 36 个主流平台,总计提供 103 个可调用接口。
- 搜索引擎:Google、百度、Bing、搜狗微信搜索。
- 社交媒体:Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑。
- 新闻资讯:BBC、Reuters、36氪、今日头条、东方财富。
- 技术开发:GitHub、StackOverflow、HackerNews、CSDN、V2EX、Dev.to、npm、PyPI、arXiv。
- 视频平台:YouTube、B 站。
- 垂直领域:豆瓣、IMDb、雪球、BOSS直聘、Wikipedia、携程等。
双重身份
bb-browser 并非单纯的“API 包装器”,它同时是一套完整的浏览器自动化工具。除了高层级的站点命令,还支持底层原子操作,形成从高层语义到底层控制的完整光谱。
高层命令示例:
bb-browser site zhihu/hot
底层原子操作:
open:打开指定页面。
snapshot:获取可访问性树。
click 与 fill:模拟点击与输入。
eval:执行任意 JavaScript。
fetch:发起带登录态的网络请求。
network:抓包分析。
screenshot:页面截图。
所有命令均支持 --json 结构化输出、--jq 内联过滤、--tab 多标签并发,非常适合集成到自动化流程中。
极速扩展
项目内置 bb-browser guide 完整教程,配合 AI Agent 可实现“一句话逆向”。开发者只需指示 Agent “帮我把 XX 网站 CLI 化”,系统便会自动抓包分析、编写适配器、测试验证。
根据认证复杂度分为三个层级:
- Tier 1 (约1分钟):Cookie 直接 fetch,如 Reddit、GitHub。
- Tier 2 (约3分钟):Bearer + CSRF 组合,如 Twitter、知乎。
- Tier 3 (约10分钟):Webpack 注入或 Pinia store 操作,如 Twitter 高级搜索、小红书。
实测表明,20 个 AI Agent 并发运行,可在同一时段内各自独立完成不同网站的逆向适配,边际成本趋近于零。这个过程本身也形成了一个有趣的 开源实战 研究案例。
部署方式与使用方式
安装启动
全局安装仅需一行命令:
npm install -g bb-browser
安装后,首先更新社区适配器并查看推荐,即可开始使用:
bb-browser site update # 拉取最新适配器
bb-browser site recommend # 匹配你的浏览习惯
bb-browser site zhihu/hot # 获取知乎热榜
三种运行模式
1. OpenClaw 模式 (推荐,零配置)
若使用 OpenClaw 平台,bb-browser 可直接调用其内置浏览器,无需安装任何 Chrome 扩展或守护进程:
bb-browser site reddit/hot --openclaw
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'
对应 Skill 已上架 ClawHub:bb-browser-openclaw
2. Chrome 扩展模式 (独立 CLI)
不依赖 OpenClaw 时,需手动安装浏览器扩展:
- 从 GitHub Releases 下载 zip 包。
- 解压后,在
chrome://extensions/ 开启开发者模式。
- 点击“加载已解压的扩展程序”,选择解压的文件夹。
3. MCP 接入模式 (Claude Code / Cursor)
作为 MCP Server 接入主流 AI 编程工具,配置如下 (例如在 Cursor 的 mcp.json 中):
{
"mcpServers": {
"bb-browser": {
"command": "npx",
"args": ["-y", "bb-browser", "--mcp"]
}
}
}
守护进程配置
bb-browser 默认在 localhost:19824 启动守护进程,可通过 --host 灵活调整:
bb-browser daemon --host 127.0.0.1 # 强制 IPv4,解决 macOS IPv6 兼容问题
bb-browser daemon --host 0.0.0.0 # 监听所有网卡,支持 Tailscale / ZeroTier 跨机器访问
典型工作流示例
当进行跨平台调研时,AI Agent 可以在几分钟内聚合多个维度的信息:
# 学术维度
bb-browser site arxiv/search "retrieval augmented generation"
# 社交讨论维度
bb-browser site twitter/search "RAG"
# 开源实现维度
bb-browser site github search rag-framework
# 技术问答维度
bb-browser site stackoverflow/search "RAG implementation"
# 中文社区维度
bb-browser site zhihu/search "RAG"
# 产业动态维度
bb-browser site 36kr/newsflash
所有输出均为结构化 JSON,可直接进入下游分析流水线。配合 --jq 过滤,可精准提取所需字段,例如 bb-browser site xueqiu/hot-stock 5 --jq ‘.items[] | {name, changePercent}’ 仅返回股票名称与涨跌幅。
总的来说,bb-browser 通过巧妙的架构设计,为 AI Agent 与真实网站交互提供了一条“捷径”。它既是一个强大的生产力工具,其实现思路也为浏览器自动化领域提供了新的视角。对于开发者而言,深入了解其技术文档和基于 Node.js 的插件生态,能帮助我们更好地定制和扩展其能力。如果你对这类前沿工具和开发实践感兴趣,欢迎到云栈社区参与更多讨论。