找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3266

积分

0

好友

458

主题
发表于 昨天 01:20 | 查看: 1| 回复: 0

你是否曾遇到过这种情况:浏览器收藏夹里的技术文章链接突然失效,变成了冷冰冰的 “404 Not Found”?或者,当你费劲地将一篇好文章复制到笔记软件时,排版错乱、代码块变形,阅读体验大打折扣。对于付费订阅的内容,一旦会员过期,那些精心收藏的“知识资产”也随之消失。

今天要介绍的 baoyu-url-to-markdown 工具,可以一劳永逸地解决这些问题。它能将任何网页完整地保存到本地的 Markdown 文件中,让你彻底告别链接失效的烦恼。

什么是 baoyu-url-to-markdown?

简单来说,这是一个能将整个网页“搬回家”的工具。它最核心的功能在于,能够将网页内容(包括文本、代码、甚至图片引用)干净、结构化地转换为 Markdown 格式。其强大之处在于“完整性”——无论是需要滚动加载的长文,还是需要登录才能查看的付费内容,它都能有效抓取。

更贴心的是,它会自动为你整理归档。例如,从 React 官网保存的文档会存放在 react.dev 文件夹下,而从 Medium 保存的文章则归入 medium.com 文件夹。每个生成的 Markdown 文件开头,都会自动记录原文的 URL、标题、描述、作者、发布时间以及抓取时间等元数据,极大地方便了后续的检索与管理。

如何安装?

前置条件

在开始安装前,请确保你的系统已满足以下两个条件:

  1. Claude Code:这是 Anthropic 推出的 AI 编程助手命令行工具。你可以访问其官网获取安装指南。
  2. Node.js 环境:用于运行 JavaScript 程序。访问 nodejs.org 下载并安装 LTS 版本。

安装步骤

安装过程非常简单,只需在终端中执行一行命令:

npx skills add https://github.com/jimliu/baoyu-skills --skill baoyu-url-to-markdown

命令解释:

  • npx skills add:用于添加一个新的技能(Skill)或工具。
  • https://github.com/jimliu/baoyu-skills:该工具的源代码仓库地址。
  • --skill baoyu-url-to-markdown:指定要安装的具体工具名称。

执行后,系统会自动完成下载和安装,整个过程仅需几秒钟。

baoyu-url-to-markdown 技能安装过程命令行截图

使用场景与操作指南

一、保存公开的技术文章

场景:你在 Vercel 官方博客看到一篇关于 AI SDK 的文章,希望保存下来深入学习。

操作步骤:

  1. 复制文章 URL:https://vercel.com/blog/introducing-the-vercel-ai-sdk
  2. 在终端执行命令:
    npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://vercel.com/blog/introducing-the-vercel-ai-sdk

工具会自动完成网页打开、内容加载、滚动触发懒加载、内容提取转换及本地保存等一系列操作。

运行结果示例:

Fetching: https://vercel.com/blog/introducing-the-vercel-ai-sdk
Mode: auto
Waiting for page to load...
Scrolling to trigger lazy load...
Capturing page content...
Saved: url-to-markdown/vercel.com/introducing-the-vercel-ai-sdk-npm-i-ai-vercel.md
Title: Introducing the Vercel AI SDK: npm i ai - Vercel

生成的文件内容预览:
文件默认保存在 url-to-markdown/vercel.com/ 目录下,开头包含完整的 Front Matter 元数据。

---
url: https://vercel.com/blog/introducing-the-vercel-ai-sdk
title: "Introducing the Vercel AI SDK: npm i ai - Vercel"
description: "An interoperable, streaming-enabled, edge-ready software development kit for AI apps built with React and Svelte."
published: "2023-06-15"
captured_at: "2026-02-03T06:01:04.021Z"
---

# Introducing the Vercel AI SDK: npm i ai - Vercel

[文章正文内容...]

二、保存需要登录或交互的页面(--wait 模式)

场景:你想保存某付费内容平台上一篇需要登录才能查看文章。

操作步骤:

  1. 使用 --wait 参数运行命令:
    npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://towardsdatascience.com/how-to-apply-agentic-coding-to-solve-problem/ --wait
  2. 命令行会提示浏览器已打开,并等待你手动操作:
    Fetching: https://towardsdatascience.com/how-to-apply-agentic-coding-to-solve-problem/
    Mode: wait
    Browser opened. Please login and navigate to the content you want to capture.
    Press Enter when ready...
  3. 此时,你可以在打开的浏览器中完成登录、等待页面完全加载、并滚动以确保所有动态内容(如懒加载图片、评论区)都已呈现。
    需要登录的网页示例截图
  4. 当页面内容准备就绪后,回到终端,按下 Enter 键。
    命令行等待用户按 Enter 确认的截图
  5. 工具会立即捕获当前浏览器窗口中的页面内容并保存为 Markdown。
    网页内容成功捕获并保存后的结果截图

三、批量归档多个页面

场景:你想一次性保存 React 和 Next.js 的官方文档首页。

操作步骤:
使用 && 连接多个命令即可实现批量抓取:

npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://react.dev/learn && \
npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://nextjs.org/docs

运行结果与目录结构:

Fetching: https://react.dev/learn
Saved: url-to-markdown/react.dev/quick-start-react.md
Title: Quick Start – React

Fetching: https://nextjs.org/docs
Saved: url-to-markdown/nextjs.org/nextjs-docs-nextjs.md
Title: Next.js Docs | Next.js

工具会自动按域名创建文件夹,生成井井有条的目录结构:

url-to-markdown/
├── react.dev/
│   └── quick-start-react.md (15KB)
├── nextjs.org/
│   └── nextjs-docs-nextjs.md (65KB)
└── vercel.com/
    └── introducing-the-vercel-ai-sdk-npm-i-ai-vercel.md (7KB)

与主流笔记工具集成

保存下来的 Markdown 文件可以轻松导入各类笔记软件,无缝融入你的知识管理流。

  • Obsidian:直接将整个 url-to-markdown 文件夹拖入你的 Obsidian 仓库(Vault)。或者,在抓取时使用 -o 参数直接指定保存路径:
    npx -y bun ~/.agents/skills/baoyu-url-to-markdown/scripts/main.ts https://example.com/article -o ~/Documents/Obsidian/Articles/article.md
  • Notion:在 Notion 页面中选择“导入” → “Markdown”,然后选择你保存的文件即可。
  • 其他支持 Markdown 的软件:大部分现代笔记软件都支持直接导入或打开 Markdown 文件。

文件开头的元数据(Front Matter)在笔记软件中尤为有用。例如,在 Obsidian 中,你可以利用 Dataview 插件,根据发布日期、文章来源等元数据动态查询和筛选文章,构建强大的个人知识库。

总结

使用 baoyu-url-to-markdown 一段时间后,最大的感受是安全感——再也不必担心精心收藏的技术文章某天突然消失。它的优势明显:内容抓取完整、文件自动分类、能处理登录墙页面,并且生成的标准化 Markdown 文件能与现有工作流完美衔接。

建议养成随手保存有价值文章的习惯,每周花少量时间进行整理和归档。工具只是辅助,持之以恒的积累和系统化的知识管理,才能让这些信息真正转化为你的能力。如果你在寻找更多类似的效率工具或开发者心得,不妨来 云栈社区 逛逛,这里汇集了许多乐于分享的开发者与实践经验。




上一篇:基于STM32与OSAL的开源物联网中控模块设计:集成SI4432/NRF24L01无线通信
下一篇:Sam Altman揭示OpenAI产品战略:Codex有望成为核心,2026年模型体验提10倍
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-7 07:45 , Processed in 0.424008 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表