就在各大 AI 巨头拼命想把你的记忆塞进云端黑盒,争着当你的“第二大脑”时,Karpathy 连发两条推文,直接掀了桌子。
一条在谈“Idea File”,宣称分享代码已经过时;一条在谈“Personal Wiki”,强调你的数据必须归你所有。这看似是技术探讨,实则是对当前整个 人工智能 生态的一次精准狙击。
这不仅仅是一场技术路线之争,更是一份关于“数字主权”的公开宣战。
RAG 的死胡同:为什么你的 AI 总是“金鱼记忆”?
你有没有发现,现在的 AI 助手,大多患有一种“金鱼综合症”?
你问它问题,它检索、回答,然后遗忘。下次你再问,它又得从头开始检索。这就是目前主流的 RAG(检索增强生成)模式的尴尬现状——看似聪明,实则毫无积累。
Karpathy 在他的推文中一针见血地指出了这个核心问题:
“Ask a subtle question that requires synthesizing five documents, and the LLM has to find and piece together the relevant fragments every time. Nothing is built up.”
每一次提问,都是一次从零开始的重新发现;每一次交互,都是一次性消费。这种“阅后即焚”的处理方式,让 AI 永远停留在“工具”层面,难以成为能持续进化的“伙伴”。
那么,出路在哪里?Karpathy 提出了一个颠覆性的新范式:LLM Wiki。
与其每次让 AI 在浩如烟海的原始文档里大海捞针,不如让它为你构建一个持久的、结构化的知识库。就像我们人类读书会做笔记一样,AI 读过、理解过的东西,应该被“编译”成一个可查询、可更新的 Wiki,让知识沉淀下来。
这不仅仅是效率的提升,更是对现有交互思维模式的降维打击。
你的记忆,凭什么归 OpenAI 所有?
如果说上面讨论的是“如何构建更聪明的大脑”,那么 Karpathy 分享的另一个项目,则直指问题的核心:“这个大脑,究竟应该归谁所有?”
他转发了一个名为 Farzapedia 的项目。这是一个用户利用大语言模型(LLM),将自己积累的 2500 篇日记和笔记,转化生成的个人维基百科。有意思的是,Karpathy 没有过多称赞它的功能,而是借此强调了四条“硬核”原则:
-
显式原则
记忆必须是可见、可查询、可管理的,而不是隐藏在模型参数里的“黑箱玄学”。
-
主权原则
数据必须存放在你自己的本地电脑里,而不是被某个 AI 厂商“绑架”在云端服务器上。
-
文件优先原则
数据应以通用的文件格式(如 Markdown 和图片)存在,不依赖于任何特定的、可能消亡的应用程序。
-
自带AI (BYOAI) 原则
你想用 Claude、GPT 还是其他什么模型,应该由你自由选择。AI 在这里只是一个读取和处理文件的通用“插座”。
说实话,这简直是对当前主流AI巨头商业模式的公开处刑。 现在许多AI产品的逻辑是:你的记忆在我的云端,你用我的闭源模型,你想完整导出?几乎不可能。它们正在试图构建一个封闭的“围墙花园”,将用户牢牢锁定在其中。
而 Karpathy 的逻辑则截然相反:数据是用户的核心资产,AI 只是处理这些资产的工具。 就像你不会因为更换了一个管家,就把家里的房产证过户给他一样。
代码已死,意图永生
更富颠覆性的是,Karpathy 提出了一个前瞻性的概念:Idea File(想法文件)。
他认为,在即将到来的 LLM 智能体(Agent)时代,分享具体的代码或应用程序的价值正在急剧下降。
“There is less of a point/need of sharing the specific code/app, you just share the idea, then the other person's agent customizes & builds it for your specific needs.”
过去,我们分享一个项目,是分享整个代码仓库;而现在,Karpathy 分享一个项目,可能只分享一个 Gist —— 一段描述核心想法的文本。
你只需要把这个“想法文件”扔给你的 AI Agent,它就能根据你的具体需求、你的技术栈、你的本地环境,为你量身定制并构建出一个属于你自己的版本。
这彻底颠覆了传统“软件分发”的逻辑。 以前是“我给你什么成品,你就用什么”;未来可能是“我给你一个意图,你的 Agent 为你现场制造一个”。
这也从另一个角度解释了为什么“个人维基”如此关键——如果没有一个属于你自己的、结构化的知识库作为上下文和“原材料”,你的 Agent 将难以深刻理解你的独特意图,更别提完美执行了。
21 世纪的核心技能:学会做“包工头”
当然,这种极致的自由和控制权,并非没有代价。
Karpathy 也非常诚实地指出,这套模式需要你亲自管理文件目录结构,需要你愿意折腾和调试。
“Certainly this is not the simplest way to get an AI to know you... but 'agent proficiency' is a CORE SKILL of the 21st century.”
这句话极其犀利。未来的能力分界线,可能不在于你拥有多少资本,而在于你能否有效驾驭 AI Agent。你需要学会成为一名指挥若定的“包工头”,而不是只会埋头干活的“搬砖工”。
对于那些习惯了被巨头“投喂”一体化、傻瓜式产品的用户来说,这无疑显得复杂且麻烦;但对于那些渴望彻底掌控自己数字命运、追求深度定制的 开发者 和极客而言,这意味着一场真正的解放。
反转:这是极客的狂欢,还是大众的未来?
平心而论,Karpathy 推崇的这套“显式记忆、数据主权、文件优先”架构,短期内恐怕很难成为大众主流。
管理本地文件、调试 AI Agent、理解结构化数据格式……这些门槛对于绝大多数普通用户来说,依然太高。很多人可能仍然宁愿牺牲部分隐私和控制权,以换取像 ChatGPT 那样简单直接的输入框。
但这并不妨碍它成为一种重要趋势的起点。正如 Linux 并未在桌面端取代 Windows,但它却定义了整个服务器和云计算的世界。Karpathy 所描绘的蓝图,很可能将成为未来“高级玩家”、技术专家和开发者的标准配置。
当所有人都在担忧 AI 会取代人类时,Karpathy 给出了另一种答案:不要让 AI 成为一个你无法理解、不可控制的黑箱,而应该把它变成你手中一把顺手、可靠的锤子。
只不过,这把强有力的锤子,必须牢牢握在你自己的手里,而不是锁在别人家的工具箱中。这场关于技术、数据与主权的讨论,值得我们所有身处数字化浪潮中的人深思。如果你想了解更多前沿的开发者观点与技术趋势碰撞,不妨来 云栈社区 逛逛,这里聚集了一群热爱折腾、乐于分享的同行者。
参考来源:
- https://x.com/karpathy/status/2040572272944324650
- https://x.com/karpathy/status/2040470801506541998