最近,各大模型厂商都在积极布局自己的AI Agent生态,业内戏称为“养龙虾”。讯飞星火也推出了自家的Agent平台——AstronClaw。
本文将以AstronClaw为例,带你探索其Skills市场中一些极具实用价值的工具,特别是如何利用 Playwright_Scraper_Skill 进行高效的网页抓取。
AstronClaw的云端部署非常简单,访问其官方网站即可快速创建实例。它不仅支持网页端直接对话,还能轻松接入企业微信、飞书、钉钉等办公软件,通常只需填写BOT ID和APP SECRET即可完成配置。

该平台支持星火、MiniMax、Kimi、GLM等多种主流模型,提供7×24小时在线的沙箱环境。

Skills 市场
AstronClaw的核心功能之一是其Skills市场。这里汇集了大量开源的AI技能插件,用户可以一键安装并使用,极大扩展了Agent的能力边界。

爬虫利器:Playwright_Scraper_Skill
在探讨这个技能之前,我们需要理解AI Agent处理网页能力的两层架构:
- 浏览器控制能力(Playwright MCP):让AI能够像真人一样操作浏览器,执行点击、输入、运行JavaScript等交互动作。
- 网页抓取能力(Playwright Scraper Skill):在浏览器控制的基础上,集成反爬策略,专门用于抓取结构复杂或带有反爬机制的网站。
简单来说:
- Playwright 是底层的浏览器自动化库。
- Playwright MCP 是将其封装为AI可调用的工具协议。
- Playwright_Scraper_Skill 则是基于上述工具编写的、具备具体抓取逻辑的技能。

这里有一个关键点需要注意:让AI直接读取整个网页的HTML会消耗巨量Token。一篇普通的技术博客,AI读取一次就可能产生8000到15000个Token。如果一次需要参考多篇文章,仅“读网页”这一项就可能花费数万Token。
问题在于,网页中真正有用的正文内容通常只占30%左右,其余70%可能是导航栏、侧边栏、广告、评论区、页脚脚本等“噪音”。因此,最佳实践是只将干净的正文内容提供给AI。
实现这一目标主要有三种方式:
web_fetch:最简单直接,抓取网页并转换为文本。缺点是无法智能识别正文,噪音多,Token浪费严重,且容易被反爬机制拦截。
- Jina Reader:专业的正文提取服务,能输出干净的Markdown格式内容。缺点是免费额度有限(通常每天200次)。
- Scrapling + html2text组合方案:先用Scrapling工具绕过反爬抓取网页,再精确定位正文标签(如
<article>、<main>),最后用html2text转换为Markdown。此方案内容干净,且没有调用次数限制。
实际应用策略建议:对于普通博客,可使用Jina Reader;对于微信公众号或反爬严格的网站,采用Scrapling方案;对于简单的静态页面,用web_fetch快速处理即可。
Markdown转换器
Markdown_Converter是一个将各类文档(如PDF、Word、PPT、Excel、HTML、CSV)转换为Markdown格式的实用技能。这在软件测试和数据预处理中非常有用。
例如,你可以先将HTML格式的聊天记录或报告转换为Markdown,再交给AI进行分析总结,能有效提升处理效率和准确性。


Agent Browser(智能体浏览器)
Agent Browser 是一个功能强大的浏览器自动化工具,其最大亮点是支持录制操作过程为视频。

它的核心特点如下:
| 特点 |
说明 |
| 🚀 快速 |
Rust 实现,有 Node.js 备用 |
| 🎯 精准交互 |
通过快照获取元素引用(@e1、@e2),再进行点击/填表 |
| 📸 截图/快照 |
支持全页截图、PDF 导出 |
| 🎬 视频录制 |
可录制操作过程 |
| 🌐 网络拦截 |
Mock 响应、模拟网络状况 |
| 💾 状态保存 |
保存登录态,下次直接恢复 |
| 📺 无头/有头 |
支持后台运行或显示浏览器窗口 |
典型用途:自动化填表、抓取动态网页内容、UI测试、批量操作。

它的长截图功能非常实用。例如,你可以轻松截取整个OpenClaw官网的页面。在与AI协作时,遇到无法复制的网页内容,使用长截图是一种高效的替代方案。

需要注意的是,云端部署的AstronClaw实例通常无法进行桌面级录屏操作。若需完整视频录制,需在本地有图形界面的环境中运行相关命令。
# 安装 agent-browser
npm install -g agent-browser
agent-browser install
# 开始录制演示
agent-browser open https://openclaw.ai --headed
agent-browser record start ./demo.webm
# ... 执行操作 ...
agent-browser record stop
FreeRide(免费模型路由)
FreeRide技能可以管理来自OpenRouter的免费AI模型,并自动按质量进行排名。它并非直接对话工具,而是为OpenClaw配置的一个模型路由。

可用免费模型包括Qwen3、Gemma、Llama等系列的多个版本。

使用流程:
- 配置免费模型:
freeride auto
- 重启OpenClaw网关:
openclaw gateway restart
- 正常发消息对话即可
本质:它帮你将OpenClaw的默认对话模型从GPT-4o、Claude等付费API,切换为OpenRouter上的免费模型,从而显著降低成本。
其他实用技能速览
Hot-finder(热点雷达)
多源热门内容搜索与Excel数据导出工具,覆盖HackerNews、Reddit、B站、YouTube、微博、小红书等国内外平台。
- 典型指令:“帮我找最近一周的AI热门视频”、“搜索Reddit科技板块的爆款帖子”、“导出B站热门前20”。

Deep_Research_Pro(深度研究)
多源深度研究代理,可将复杂主题拆解为子问题,进行多元化搜索,并生成带引用来源的结构化报告,无需任何付费API Key。

Wed_1.0.1(第一性原理规划)
“What Would Elon Do?” 这个技能应用了马斯克的“第一性原理”思维,能将任何想法转化为强执行导向的计划,生成包含商业战略、MVP规格和首周行动清单的完整路线图。

其思考框架通常包括:第一性原理拆解、10倍目标重构、周末可完成MVP规划、以及详细的周作战计划。

qmd(本地文档搜索引擎)
用于本地文件的搜索与索引(支持BM25/向量/重排),并支持MCP模式。你可以用它索引个人的笔记(~/notes/)、项目文档(~/projects/)、电子书(~/books/)等所有Markdown文件。
启动qmd的MCP服务后,Claude Code、OpenClaw等人工智能工具就能直接调用它来搜索你的本地知识库。例如,AI可以回答“在我之前的笔记里关于XXX的内容是什么?”。

索引和搜索过程可以完全由Agent代劳,实现个人知识库与AI的深度集成。
超拟人合成(TTS)
讯飞提供的超拟人文本转语音技能,能将文字转化为自然流畅的人声,精准模拟呼吸、叹气、语速变化等副语言现象。

总结与生态
AstronClaw背后是讯飞开源的astron-agent项目,这是一个企业级、商业友好的Agentic Workflow开发平台,融合了AI工作流编排、模型管理、MCP工具集、RPA自动化等特性。

此外,平台还有一些提升体验的细节功能,例如在企业微信中接入机器人时,可以附带历史聊天记录,让AI拥有上下文。还有Proactive_Agent(主动型智能体),能够从任务执行者转变为主动预测需求并提出建议的合作伙伴。

通过本文的介绍,我们可以看到AstronClaw及其Skills市场为开发者和企业提供了丰富的AI能力模块。从高效的Playwright爬虫到本地知识库管理,从免费模型切换到专业的行业报告生成,这些工具集正在让AI Agent变得愈发强大和实用。对于想要探索AI Agent应用落地的开发者而言,这无疑是一个值得深入研究的宝库。欢迎在云栈社区交流更多关于AstronClaw和AI Agent的实战经验。