Stagehand 是一个创新的浏览器自动化框架,它允许开发者通过自然语言指令与代码逻辑相结合的方式来控制 Web 浏览器。其设计旨在将大语言模型(LLM)的理解能力与代码的逻辑控制相结合,使复杂流程的自动化变得直观、灵活且稳定可靠。
在技术实现上,Stagehand 底层基于成熟的 Playwright 框架构建,这意味着它可以无缝集成到现有的 Playwright 项目中。其核心能力在于能够调用如 OpenAI、Anthropic 等主流 大语言模型(LLM)的计算机使用(Computer Use)能力,并将模型的理解与决策通过代码进行精确执行和流程控制,实现了自然语言指令与脚本逻辑的灵活编排。
为了帮助开发者进行技术选型,Stagehand 官方提供了在不同模型下的详细测评结果,涵盖了任务执行的准确性、成本以及速度等多个维度,为实际应用提供了有价值的参考数据。

|