找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3062

积分

0

好友

412

主题
发表于 12 小时前 | 查看: 4| 回复: 0

想要让AI帮你自动制作电影解说视频,或者把乔布斯、马斯克的思维方式“安装”到你的电脑里,甚至拥有一个完全离线的iPhone AI助手吗?今天分享的三个开源项目,或许能为你打开一扇新的大门。它们分别解决了内容创作、决策辅助和移动端隐私这三个不同维度的需求。

1. narrator-ai-cli-skill:让 AI Agent 自动制作电影解说视频

narrator-ai-cli-skill 是一个专为 AI Agent(如 Cursor、Windsurf、Claude Code 等)设计的技能描述文件。它的核心作用是“教会”AI智能体如何调用 narrator-ai-cli 这个命令行工具,从而实现从指令到成片的电影解说视频全自动生成。

Narrator AI CLI Skill 说明截图

当你将这份技能文件配置到你的AI平台后,事情就变得简单了:你只需要用自然语言下达指令,例如“帮我做一个《飞驰人生》的电影解说视频,要喜剧风格”。接下来,AI会接管一切,自动完成搜索影片、选择模板、挑选背景音乐、生成配音文案、合成视频并返回下载链接的完整流程。

项目本身内置了丰富的资源库,包括93部电影素材、146首背景音乐、63种可选音色以及超过90款视觉模板。它还支持独立的声音克隆任务,并提供了任务开始前的成本预算估算功能,确保了整个流程的透明与可控。

已测试平台兼容性列表

这份技能文件采用Markdown格式编写,理论上兼容所有支持读取Markdown文件的AI Agent平台。本地运行需要Python 3.10及以上环境,并且需要预先安装 narrator-ai-cli (v0.1.0+) 及其依赖。

SKILL.md 文档内容结构表

项目采用MIT协议开源。不过需要注意的是,其底层依赖的视频生成服务并非完全开放,用户需要联系开发者获取专属的API Key才能激活完整的工作流。

项目地址:https://github.com/jieshuo-ai/narrator-ai-cli-skill

2. nuwa-skill(女娲):蒸馏任何人的思维方式

如果说上一个项目是赋予AI“手脚”,那么 nuwa-skill(女娲)项目则是为AI注入“大脑”——更确切地说,是注入你指定的任何行业领袖的思维方式。这是一个为Claude Code等AI开发环境打造的开源技能项目。

女娲.skill 项目介绍页

它超越了简单的“角色扮演”。系统会深入分析目标人物的公开资料,提炼出其底层的心智模型、决策框架、价值底线乃至表达习惯。你只需要输入一个名字,系统背后的6个Agent便会协同工作,在全网搜集该人物的著作、访谈等记录,经过三重逻辑验证后,打包生成一份包含其完整“认知操作系统”的技能文件。

为了让用户快速上手,作者已经预先蒸馏了7位知名人物,包括史蒂夫·乔布斯、埃隆·马斯克、查理·芒格、理查德·费曼,以及国内的张雪峰老师等。你可以通过 npx skills add 命令一键安装,即刻让这些“大脑”为你提供决策参考。

女娲技能提取的六个认知层次

效果如何?看看对话示例就明白了。当向“蒸馏版乔布斯”提问“OpenAI和Anthropic谁的方向对”时,它并没有直接回答,而是从“品味”和“控制硬件”的角度给出了极具乔布斯风格的批判性见解。

蒸馏乔布斯后关于AI公司的对话

而“蒸馏版张雪峰”在回答“普通家庭孩子该不该报金融专业”时,其直接、务实甚至有些犀利的风格也高度还原。

蒸馏张雪峰后关于专业选择的对话

项目同样采用MIT协议开源,所有方法论和测试日志公开。作者也坦诚指出了局限性:系统构建的只是基于公开信息的、过去某个时间点的“认知快照”,它无法学习人类的直觉,也不能代表名人不公开的真实想法。

项目地址:https://github.com/alchaincyf/nuwa-skill

3. PhoneClaw:完全离线、保护隐私的 iPhone AI 助理

如果你的关注点在于移动端的隐私和安全,那么 PhoneClaw 这个项目值得一看。它是一个专为iPhone打造、完全在设备端运行的本地AI Agent。

它的核心是将谷歌的Gemma 4大模型直接“塞进”你的iPhone里运行。所有对话、图片处理都在本地完成,无需任何网络连接,从根本上杜绝了数据上传和隐私泄露的担忧。

它能做什么?
首先,它具备多模态图片理解能力。你可以直接拍照或从相册选择图片,让它本地识别内容、解读图表或描述场景,照片绝不会离开你的手机。

PhoneClaw 核心能力介绍

其次,它能与手机系统深度集成。通过简单的自然语言指令,它就能帮你创建日历事件、设置提醒事项,甚至从一段文字中提取联系人信息并保存到通讯录中。

PhoneClaw 内置 Skill 示例

它的技能扩展机制非常轻量。如果你想为它增加新功能,通常只需要编辑一个Markdown格式的技能描述文件即可,无需重新编译整个App。

门槛与要求
项目100%使用Swift开发,开源协议为Apache 2.0。但上手有一定门槛:

  • 开发环境:需要macOS和Xcode 16。
  • 系统要求:iPhone需升级至 iOS 17或更高版本。
  • 硬件配置:运行轻量版模型(3.58GB)建议A16芯片起;运行完整版模型(5.22GB)则推荐iPhone 15 Pro及以上机型。官方建议先安装App空壳,再在手机端下载模型,速度会更快。

项目地址:https://github.com/kellyvv/PhoneClaw


这三个项目从不同角度展示了当前AI开源社区的活跃思路:自动化工作流、认知能力复用、终端侧隐私计算。如果你对AI Agent的实际应用感兴趣,不妨到 云栈社区 的对应板块看看,那里有更多开发者在分享类似的实践和探讨。




上一篇:游戏开发实战:GPT、Claude与多智能体框架如何重塑各岗位工作流
下一篇:HAOC硬件辅助隔离:为Linux内核安全打造的“隔离舱”
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-7 15:19 , Processed in 0.568756 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表