找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4404

积分

0

好友

616

主题
发表于 2 小时前 | 查看: 5| 回复: 0

最近,各大模型厂商都在积极布局自己的AI Agent生态,业内戏称为“养龙虾”。讯飞星火也推出了自家的Agent平台——AstronClaw

本文将以AstronClaw为例,带你探索其Skills市场中一些极具实用价值的工具,特别是如何利用 Playwright_Scraper_Skill 进行高效的网页抓取。

AstronClaw的云端部署非常简单,访问其官方网站即可快速创建实例。它不仅支持网页端直接对话,还能轻松接入企业微信、飞书、钉钉等办公软件,通常只需填写BOT IDAPP SECRET即可完成配置。

AstronClaw上线宣传页

该平台支持星火、MiniMax、Kimi、GLM等多种主流模型,提供7×24小时在线的沙箱环境。

企业微信渠道配置界面

Skills 市场

AstronClaw的核心功能之一是其Skills市场。这里汇集了大量开源的AI技能插件,用户可以一键安装并使用,极大扩展了Agent的能力边界。

Skills市场界面

爬虫利器:Playwright_Scraper_Skill

在探讨这个技能之前,我们需要理解AI Agent处理网页能力的两层架构:

  1. 浏览器控制能力(Playwright MCP):让AI能够像真人一样操作浏览器,执行点击、输入、运行JavaScript等交互动作。
  2. 网页抓取能力(Playwright Scraper Skill):在浏览器控制的基础上,集成反爬策略,专门用于抓取结构复杂或带有反爬机制的网站。

简单来说:

  • Playwright 是底层的浏览器自动化库。
  • Playwright MCP 是将其封装为AI可调用的工具协议。
  • Playwright_Scraper_Skill 则是基于上述工具编写的、具备具体抓取逻辑的技能。

Playwright抓取技能在Skills市场中的展示

这里有一个关键点需要注意:让AI直接读取整个网页的HTML会消耗巨量Token。一篇普通的技术博客,AI读取一次就可能产生8000到15000个Token。如果一次需要参考多篇文章,仅“读网页”这一项就可能花费数万Token。

问题在于,网页中真正有用的正文内容通常只占30%左右,其余70%可能是导航栏、侧边栏、广告、评论区、页脚脚本等“噪音”。因此,最佳实践是只将干净的正文内容提供给AI

实现这一目标主要有三种方式:

  • web_fetch:最简单直接,抓取网页并转换为文本。缺点是无法智能识别正文,噪音多,Token浪费严重,且容易被反爬机制拦截。
  • Jina Reader:专业的正文提取服务,能输出干净的Markdown格式内容。缺点是免费额度有限(通常每天200次)。
  • Scrapling + html2text组合方案:先用Scrapling工具绕过反爬抓取网页,再精确定位正文标签(如<article><main>),最后用html2text转换为Markdown。此方案内容干净,且没有调用次数限制。

实际应用策略建议:对于普通博客,可使用Jina Reader;对于微信公众号或反爬严格的网站,采用Scrapling方案;对于简单的静态页面,用web_fetch快速处理即可。

Markdown转换器

Markdown_Converter是一个将各类文档(如PDF、Word、PPT、Excel、HTML、CSV)转换为Markdown格式的实用技能。这在软件测试和数据预处理中非常有用。

例如,你可以先将HTML格式的聊天记录或报告转换为Markdown,再交给AI进行分析总结,能有效提升处理效率和准确性。

Markdown转换器技能界面

使用Markdown转换器处理文档的对话示例

Agent Browser(智能体浏览器)

Agent Browser 是一个功能强大的浏览器自动化工具,其最大亮点是支持录制操作过程为视频

Agent Browser技能界面

它的核心特点如下:

特点 说明
🚀 快速 Rust 实现,有 Node.js 备用
🎯 精准交互 通过快照获取元素引用(@e1、@e2),再进行点击/填表
📸 截图/快照 支持全页截图、PDF 导出
🎬 视频录制 可录制操作过程
🌐 网络拦截 Mock 响应、模拟网络状况
💾 状态保存 保存登录态,下次直接恢复
📺 无头/有头 支持后台运行或显示浏览器窗口

典型用途:自动化填表、抓取动态网页内容、UI测试、批量操作。

Agent Browser功能详解

它的长截图功能非常实用。例如,你可以轻松截取整个OpenClaw官网的页面。在与AI协作时,遇到无法复制的网页内容,使用长截图是一种高效的替代方案。

使用Agent Browser进行长截图演示

需要注意的是,云端部署的AstronClaw实例通常无法进行桌面级录屏操作。若需完整视频录制,需在本地有图形界面的环境中运行相关命令。

# 安装 agent-browser
npm install -g agent-browser
agent-browser install

# 开始录制演示
agent-browser open https://openclaw.ai --headed
agent-browser record start ./demo.webm
# ... 执行操作 ...
agent-browser record stop

FreeRide(免费模型路由)

FreeRide技能可以管理来自OpenRouter的免费AI模型,并自动按质量进行排名。它并非直接对话工具,而是为OpenClaw配置的一个模型路由。

FreeRide技能界面

可用免费模型包括Qwen3、Gemma、Llama等系列的多个版本。

FreeRide提供的免费模型列表

使用流程

  1. 配置免费模型:freeride auto
  2. 重启OpenClaw网关:openclaw gateway restart
  3. 正常发消息对话即可

本质:它帮你将OpenClaw的默认对话模型从GPT-4o、Claude等付费API,切换为OpenRouter上的免费模型,从而显著降低成本。

其他实用技能速览

Hot-finder(热点雷达)

多源热门内容搜索与Excel数据导出工具,覆盖HackerNews、Reddit、B站、YouTube、微博、小红书等国内外平台。

  • 典型指令:“帮我找最近一周的AI热门视频”、“搜索Reddit科技板块的爆款帖子”、“导出B站热门前20”。

Hot-finder技能介绍

Deep_Research_Pro(深度研究)

多源深度研究代理,可将复杂主题拆解为子问题,进行多元化搜索,并生成带引用来源的结构化报告,无需任何付费API Key。

Deep_Research_Pro技能介绍

Wed_1.0.1(第一性原理规划)

“What Would Elon Do?” 这个技能应用了马斯克的“第一性原理”思维,能将任何想法转化为强执行导向的计划,生成包含商业战略、MVP规格和首周行动清单的完整路线图。

Wed技能触发示例

其思考框架通常包括:第一性原理拆解、10倍目标重构、周末可完成MVP规划、以及详细的周作战计划。

Wed技能生成的详细计划示例

qmd(本地文档搜索引擎)

用于本地文件的搜索与索引(支持BM25/向量/重排),并支持MCP模式。你可以用它索引个人的笔记(~/notes/)、项目文档(~/projects/)、电子书(~/books/)等所有Markdown文件。

启动qmd的MCP服务后,Claude Code、OpenClaw等人工智能工具就能直接调用它来搜索你的本地知识库。例如,AI可以回答“在我之前的笔记里关于XXX的内容是什么?”。

qmd使用教程

索引和搜索过程可以完全由Agent代劳,实现个人知识库与AI的深度集成。

超拟人合成(TTS)

讯飞提供的超拟人文本转语音技能,能将文字转化为自然流畅的人声,精准模拟呼吸、叹气、语速变化等副语言现象。

超拟人合成与一句话复刻技能

总结与生态

AstronClaw背后是讯飞开源的astron-agent项目,这是一个企业级、商业友好的Agentic Workflow开发平台,融合了AI工作流编排、模型管理、MCP工具集、RPA自动化等特性。

Astron企业级平台介绍

此外,平台还有一些提升体验的细节功能,例如在企业微信中接入机器人时,可以附带历史聊天记录,让AI拥有上下文。还有Proactive_Agent(主动型智能体),能够从任务执行者转变为主动预测需求并提出建议的合作伙伴。

我的技能管理界面

通过本文的介绍,我们可以看到AstronClaw及其Skills市场为开发者和企业提供了丰富的AI能力模块。从高效的Playwright爬虫到本地知识库管理,从免费模型切换到专业的行业报告生成,这些工具集正在让AI Agent变得愈发强大和实用。对于想要探索AI Agent应用落地的开发者而言,这无疑是一个值得深入研究的宝库。欢迎在云栈社区交流更多关于AstronClaw和AI Agent的实战经验。




上一篇:OpenClaw七大核心技能实战:网络工程师如何用AI代理实现运维自动化
下一篇:Vite+ 开源发布:一个统一JavaScript开发工具链的尝试
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-15 09:34 , Processed in 0.605900 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表