Skills火了。
但你是否觉得,看完各种保姆级教程,收藏了一大堆,然后就没有然后了?大部分人的真实状态是:知道Skills厉害,却用不起来;想自己做一个,但觉得从头学太难,想想就放弃了。
这就像装修房子,从打地基开始自己盖,要学的东西太多,很容易放弃。更聪明的方式是“二次开发”:找到一个与你需求相近的开源项目,看懂它的工作原理,然后改成你需要的样子。这才是站在巨人肩膀上,利用开源社区的最大价值。
本文将以一个PPT生成Skills为例,手把手演示完整的二次开发过程,特别是将依赖谷歌API的原版,改造为国内可用的版本,并分享过程中遇到的所有坑和解决方案。
效果演示:用Skills生成PPT有多简单
整个过程就像在指挥AI干活:
- 启动Skill:在Claude Code中输入Skill名称。
- 描述需求:用自然语言告诉它你想做什么PPT,可以指定文件、粘贴内容或直接描述主题。
我想生成一个 3 页的 PPT,主题是"766学徒法则:AI时代年轻人的职业突围指南",对应的文本内容在XXX
使用矢量插画风格,2K 分辨率。
- 交互确认:Claude会依次询问你PPT风格、页数和分辨率,你只需按需选择。



- 等待生成:确认后,工具自动调用AI模型生成每一页PPT图片,并保存到本地目录。
============================================================
PPT生成器启动
============================================================
风格: styles/vector-illustration.md
分辨率: 2K
页数: 3
============================================================
正在生成第 1 页...
✓ 第 1 页已保存: outputs/20260118_113820/images/slide-01.png
正在生成第 2 页...
✓ 第 2 页已保存: outputs/20260118_113820/images/slide-02.png
正在生成第 3 页...
✓ 第 3 页已保存: outputs/20260118_113820/images/slide-03.png
============================================================
生成完成!
============================================================
📁 输出目录: outputs/20260118_113820/
🎬 打开播放网页: outputs/20260118_113820/index.html

- 生成视频(可选):图片生成后,继续要求“生成转场视频”,AI会自动分析页面差异、生成提示词并调用视频模型合成完整演示视频。
二次开发实战:从官方API到国内可用版本
下面以NanoBanana PPT生成Skill为例,演示完整的二次开发流程。我们将改造其最大的使用障碍——将依赖谷歌Gemini API的原版,改为使用第三方中转API的国内可用版。
项目原版:基于谷歌Gemini API
原版项目使用谷歌的Gemini API生成图片,核心环境搭建步骤如下。
步骤1:获取与准备项目
下载项目文件并解压,确保目录中包含 .py、requirements.txt 及 styles 文件夹。
步骤2:创建并激活Python虚拟环境
在项目根目录下执行:
python3 -m venv venv
source venv/bin/activate
激活后,命令行提示符前应出现 (venv) 标识。
步骤3:安装依赖包
使用官方PyPI源安装必要的Python库:
pip install google-genai pillow python-dotenv -i https://pypi.org/simple
步骤4:配置API信息
复制环境变量模板并填入你的Gemini API配置:
cp .env.example .env
编辑 .env 文件:
GEMINI_API_KEY=你的API密钥
GEMINI_BASE_URL=https://你的API地址
GEMINI_MODEL=gemini-3-pro-image-preview
步骤5:测试API连接
在修改代码前,强烈建议先用一个简单的脚本测试API连通性,确保密钥和地址正确。
踩坑记录:环境配置常见问题
在实际操作中,你可能会遇到以下问题:

- 踩坑1:pip安装失败。确保使用官方源
-i https://pypi.org/simple。
- 踩坑2:API路径重复报错。
GEMINI_BASE_URL 不要以 /v1 结尾,库会自动追加。
- 踩坑5:Skill执行时找不到依赖。确保在虚拟环境中运行Skill,而非系统Python环境。
解决了环境问题,最大的障碍浮现:谷歌API在国内直接访问困难,网络不稳定。
二次开发:改造为国内可用版
核心思路是将API调用从谷歌官方切换到兼容的第三方中转服务。以下是改造步骤。
步骤1:复制项目
保留原项目,复制一份用于修改:
cp -r NanoBanana_image_ppt_skills NanoBanana_image_ppt_skills_国内版
步骤2:获取第三方API
注册一个提供Gemini模型中转的第三方服务商,获取其API密钥和基础地址。
步骤3:修改配置文件
打开新项目的 .env 文件,替换为第三方API信息:
GEMINI_API_KEY=你的第三方API密钥
GEMINI_BASE_URL=https://你的第三方API地址 # 重点:不要带 /v1
GEMINI_MODEL=gemini-3-pro-image-preview
步骤4:处理API调用兼容性问题
部分第三方API与google-genai官方库存在兼容性问题。这里有两种实现方式:

方案A:官方库方式(代码简洁,但可能不兼容)
如果第三方API完全兼容谷歌官方接口,则无需改动核心代码,仅需修改配置。
方案B:HTTP请求方式(兼容性更好,调试方便)
如果方案A失败,可以绕过官方库,直接使用httpx等库发送HTTP请求。这种方式代码量稍多,但能清晰看到请求与响应的原始数据,更容易调试。
建议先尝试方案A,若不通则改用方案B。项目资源包中提供了两种方式的完整代码。
二次开发中的进阶踩坑点
切换到第三方API时,可能会遇到更隐蔽的问题:

- 踩坑6:官方库方式调不通。由于库内部封装,错误信息模糊,可切换到HTTP请求方式直接调试。
- 踩坑7:返回格式解析失败。第三方API返回的JSON结构可能与官方响应不同,需要适配解析逻辑。
- 踩坑8:图片数据解码失败。注意API返回的图片
base64数据可能包含前缀或格式差异,需正确处理。
总结与资源
通过“二次开发”,我们成功将一个受限于网络环境的开源工具,改造为适合国内使用的版本。这个过程的核心不是从零造轮子,而是理解、调整并复用现有成果。
这种思路可以复用到任何人工智能相关的开源项目上。今天你改造的是一个PPT生成器,明天就可以是基于此框架的课件生成器、海报设计工具或产品示意图生成器。开源项目提供了一个强大的“底座”,而你的需求和创新决定了它的最终形态。
别再停留在收藏教程的阶段。真正的成长始于动手实践,从改几行配置、修复一个报错开始。希望这篇结合实战与踩坑记录的指南,能为你打开一扇通往AI应用开发的大门。欢迎在云栈社区交流你在实践中遇到的任何问题。