找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4351

积分

0

好友

597

主题
发表于 1 小时前 | 查看: 2| 回复: 0

Chrome 无疑是当下的浏览器王者,凭借流畅的使用体验和便捷的调试功能成为大众首选。即使在 AI Agent、网页数据采集、自动化测试或 LLM 训练数据获取这类技术场景中,开发者们也常常以 headless Chrome 为核心,通过 Puppeteer、Playwright 等工具来实现控制与操作。

全球浏览器市场份额统计图表 (2025-2026)

然而,这种做法背后隐藏着一个长期被忽视的核心问题:我们始终在用一款为人类交互设计的庞大浏览器,去掉界面后,强行让它去执行自动化任务。这直接导致了启动慢、内存占用过高、CPU 负载大以及并发能力受限等一系列痛点。

随着人工智能的快速发展,浏览器的定位早已悄然改变——过去是给人使用的浏览工具,如今更是为 AI 服务的执行引擎。

Lightpanda无头浏览器概念图

在 AI Agent 爆发的当下,浏览器这一容易被忽视的基础设施,正迎来全新的重构。GitHub 上名为 Lightpanda Browser无头浏览器 项目,就是一个专为 AI Agent 和自动化场景从零打造的全新引擎。

开源地址https://github.com/lightpanda-io/browser

Lightpanda 既非 Chromium 的分支,也非 WebKit 的补丁版,而是基于 Zig 语言全新开发,针对自动化场景做了深度性能优化。实测数据显示,其执行速度比 Chrome 快 11 倍:

执行时间对比:Lightpanda 2.3秒 vs Chrome 25.2秒

内存峰值占用仅为 Chrome 的 1/9:

内存占用对比:Lightpanda 24MB vs Chrome 207MB

目前,该项目在 GitHub 上已收获超过 23k Star,受到越来越多开发者的关注:

Lightpanda GitHub项目页面,Star数23.3k

简单来说,Lightpanda 就是一个为机器而不是人类设计的浏览器,它具备以下核心能力:

  • 执行 JavaScript
  • 支持 Web API(持续完善中)
  • 兼容 CDP(Chrome DevTools Protocol,可接入 Puppeteer / Playwright)
  • 没有 UI(纯 Headless 模式)

其官方定义是:一个从零构建、专为 AI 和自动化设计的浏览器。


快速安装

方式一:直接下载二进制(推荐)

根据不同操作系统,选择对应的命令进行下载和安装。

Linux (x86_64):

curl -L -o lightpanda https://github.com/lightpanda-io/browser/releases/download/nightly/lightpanda-x86_64-linux && \
chmod a+x ./lightpanda

Mac (Apple Silicon, aarch64):

curl -L -o lightpanda https://github.com/lightpanda-io/browser/releases/download/nightly/lightpanda-aarch64-macos && \
chmod a+x ./lightpanda

Windows:

  • 可通过 WSL2 环境,按上述 Linux 方式安装。
  • 也可在 Windows 主机上安装 Puppeteer 等工具进行连接。

所有二进制包的下载地址均在此发布页:https://github.com/lightpanda-io/browser/releases/tag/nightly

GitHub Releases页面资产下载列表

方式二:使用 Docker

对于喜欢容器化部署的开发者,可以直接使用 Docker 运行:

docker run -d --name lightpanda -p 9222:9222 lightpanda/browser:nightly

启动后,容器会默认开启 CDP 服务,并监听 9222 端口。


测试与使用

基础 CLI 命令

抓取一个网页,先来个最简单的命令试试:

./lightpanda fetch https://www.jd.com

执行后,你将得到:

  • 完整的 HTML 内容
  • JavaScript 执行后的最终结果
  • 详细的网络请求日志

不过,Lightpanda 最强的特性并非其 CLI,而是其对 CDP 协议的兼容能力,这意味着它可以无缝接管 Puppeteer 等主流自动化工具。

启动 CDP 服务并连接 Puppeteer

首先,启动 Lightpanda 的 CDP 服务:

./lightpanda serve \
  --host 127.0.0.1 \
  --port 9222

启动成功后,终端会显示类似 server running address = 127.0.0.1:9222 的信息。

接下来,你可以使用以下 Puppeteer 代码连接到 Lightpanda,而非 Chrome:

'use strict'
import puppeteer from 'puppeteer-core';

// 连接 Lightpanda,而不是 Chrome
const browser = await puppeteer.connect({
  browserWSEndpoint: "ws://127.0.0.1:9222",
});

const context = await browser.createBrowserContext();
const page = await context.newPage();

// 国内网站示例:抓取 B站
await page.goto('https://www.bilibili.com', {
  waitUntil: "networkidle0"
});

// 获取页面所有链接
const links = await page.evaluate(() => {
  return Array.from(document.querySelectorAll('a')).map(a => a.href);
});

console.log(links);

await page.close();
await context.close();
await browser.disconnect();

这段代码演示了如何通过 WebSocket 连接到本地的 Lightpanda 服务,并执行页面导航、元素提取等常见自动化操作。得益于对 CDP 的原生支持,你可以将现有基于 Puppeteer 的脚本几乎无缝迁移到 Lightpanda 上,并立即享受到性能提升带来的好处。

从底层语言 Zig 的选择到架构设计,Lightpanda 都明确指向了高性能与低资源消耗,为大规模、高频次的自动化任务和 AI Agent 场景提供了一个值得尝试的新选择。如果你正在为现有无头浏览方案的资源开销和速度问题烦恼,不妨试试这个新工具。更多技术细节和社区讨论,欢迎在 云栈社区 的相关板块交流。




上一篇:Claude Code 本地安装与核心使用指南:从零上手AI编程助手
下一篇:从裁员断联到AI冲击:程序员的职场关系与职业危机杂谈
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-28 07:12 , Processed in 0.513056 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表