你是否曾遇到过这种情况:浏览器收藏夹里的技术文章链接突然失效,变成了冷冰冰的 “404 Not Found”?或者,当你费劲地将一篇好文章复制到笔记软件时,排版错乱、代码块变形,阅读体验大打折扣。对于付费订阅的内容,一旦会员过期,那些精心收藏的“知识资产”也随之消失。
今天要介绍的 baoyu-url-to-markdown 工具,可以一劳永逸地解决这些问题。它能将任何网页完整地保存到本地的 Markdown 文件中,让你彻底告别链接失效的烦恼。
什么是 baoyu-url-to-markdown?
简单来说,这是一个能将整个网页“搬回家”的工具。它最核心的功能在于,能够将网页内容(包括文本、代码、甚至图片引用)干净、结构化地转换为 Markdown 格式。其强大之处在于“完整性”——无论是需要滚动加载的长文,还是需要登录才能查看的付费内容,它都能有效抓取。
更贴心的是,它会自动为你整理归档。例如,从 React 官网保存的文档会存放在 react.dev 文件夹下,而从 Medium 保存的文章则归入 medium.com 文件夹。每个生成的 Markdown 文件开头,都会自动记录原文的 URL、标题、描述、作者、发布时间以及抓取时间等元数据,极大地方便了后续的检索与管理。
如何安装?
前置条件
在开始安装前,请确保你的系统已满足以下两个条件:
- Claude Code:这是 Anthropic 推出的 AI 编程助手命令行工具。你可以访问其官网获取安装指南。
- Node.js 环境:用于运行 JavaScript 程序。访问 nodejs.org 下载并安装 LTS 版本。
安装步骤
安装过程非常简单,只需在终端中执行一行命令:
npx skills add https://github.com/jimliu/baoyu-skills --skill baoyu-url-to-markdown
命令解释:
npx skills add:用于添加一个新的技能(Skill)或工具。
https://github.com/jimliu/baoyu-skills:该工具的源代码仓库地址。
--skill baoyu-url-to-markdown:指定要安装的具体工具名称。
执行后,系统会自动完成下载和安装,整个过程仅需几秒钟。

使用场景与操作指南
一、保存公开的技术文章
场景:你在 Vercel 官方博客看到一篇关于 AI SDK 的文章,希望保存下来深入学习。
操作步骤:
- 复制文章 URL:
https://vercel.com/blog/introducing-the-vercel-ai-sdk
- 在终端执行命令:
npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://vercel.com/blog/introducing-the-vercel-ai-sdk
工具会自动完成网页打开、内容加载、滚动触发懒加载、内容提取转换及本地保存等一系列操作。
运行结果示例:
Fetching: https://vercel.com/blog/introducing-the-vercel-ai-sdk
Mode: auto
Waiting for page to load...
Scrolling to trigger lazy load...
Capturing page content...
Saved: url-to-markdown/vercel.com/introducing-the-vercel-ai-sdk-npm-i-ai-vercel.md
Title: Introducing the Vercel AI SDK: npm i ai - Vercel
生成的文件内容预览:
文件默认保存在 url-to-markdown/vercel.com/ 目录下,开头包含完整的 Front Matter 元数据。
---
url: https://vercel.com/blog/introducing-the-vercel-ai-sdk
title: "Introducing the Vercel AI SDK: npm i ai - Vercel"
description: "An interoperable, streaming-enabled, edge-ready software development kit for AI apps built with React and Svelte."
published: "2023-06-15"
captured_at: "2026-02-03T06:01:04.021Z"
---
# Introducing the Vercel AI SDK: npm i ai - Vercel
[文章正文内容...]
二、保存需要登录或交互的页面(--wait 模式)
场景:你想保存某付费内容平台上一篇需要登录才能查看文章。
操作步骤:
- 使用
--wait 参数运行命令:
npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://towardsdatascience.com/how-to-apply-agentic-coding-to-solve-problem/ --wait
- 命令行会提示浏览器已打开,并等待你手动操作:
Fetching: https://towardsdatascience.com/how-to-apply-agentic-coding-to-solve-problem/
Mode: wait
Browser opened. Please login and navigate to the content you want to capture.
Press Enter when ready...
- 此时,你可以在打开的浏览器中完成登录、等待页面完全加载、并滚动以确保所有动态内容(如懒加载图片、评论区)都已呈现。

- 当页面内容准备就绪后,回到终端,按下
Enter 键。

- 工具会立即捕获当前浏览器窗口中的页面内容并保存为 Markdown。

三、批量归档多个页面
场景:你想一次性保存 React 和 Next.js 的官方文档首页。
操作步骤:
使用 && 连接多个命令即可实现批量抓取:
npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://react.dev/learn && \
npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://nextjs.org/docs
运行结果与目录结构:
Fetching: https://react.dev/learn
Saved: url-to-markdown/react.dev/quick-start-react.md
Title: Quick Start – React
Fetching: https://nextjs.org/docs
Saved: url-to-markdown/nextjs.org/nextjs-docs-nextjs.md
Title: Next.js Docs | Next.js
工具会自动按域名创建文件夹,生成井井有条的目录结构:
url-to-markdown/
├── react.dev/
│ └── quick-start-react.md (15KB)
├── nextjs.org/
│ └── nextjs-docs-nextjs.md (65KB)
└── vercel.com/
└── introducing-the-vercel-ai-sdk-npm-i-ai-vercel.md (7KB)
与主流笔记工具集成
保存下来的 Markdown 文件可以轻松导入各类笔记软件,无缝融入你的知识管理流。
文件开头的元数据(Front Matter)在笔记软件中尤为有用。例如,在 Obsidian 中,你可以利用 Dataview 插件,根据发布日期、文章来源等元数据动态查询和筛选文章,构建强大的个人知识库。
总结
使用 baoyu-url-to-markdown 一段时间后,最大的感受是安全感——再也不必担心精心收藏的技术文章某天突然消失。它的优势明显:内容抓取完整、文件自动分类、能处理登录墙页面,并且生成的标准化 Markdown 文件能与现有工作流完美衔接。
建议养成随手保存有价值文章的习惯,每周花少量时间进行整理和归档。工具只是辅助,持之以恒的积累和系统化的知识管理,才能让这些信息真正转化为你的能力。如果你在寻找更多类似的效率工具或开发者心得,不妨来 云栈社区 逛逛,这里汇集了许多乐于分享的开发者与实践经验。