Kimi K2.6 发布并开源了,代码和 Agent 能力大幅提升。这次国产模型又往前迈了一大步,龙虾终于可以换更好的替代品了。
Claude Code 的源码前不久泄露了,这事想必大家都听说了。不过因为缺了一些东西,想在本地方便地跑起来并不容易——至少我拿最近几个国产大模型试了一遍,基本全军覆没。
上周看到群友在夸 K2.6 code preview,好不容易等到正式发布,可一开始没有申请体验资格,我第一时间还是测了这个 case。

我同时开了两个 Agent:一个跑 Kimi Code,另一个跑 Claude Code,但底层用的都是 K2.6 code 模型。任务很简单——在 Windows 上把泄露的 Claude Code 源码完整部署起来。
都知道 Kimi Code 的壳肯定不如 Claude Code 精致,但出乎意料的是,这次 Kimi Code 先完成了(当然,仅一次测试,可能随机性比较大)。整个过程大概花了 3 个小时。

两个 CLI Agent 总计消耗了 Allegretto 订阅一周用量的 13%。之前我用其他国产模型在 Windows 下部署这份泄露代码都没成功过,确实难。

启动和功能调用都正常。底层用 Kimi Code 的认证,启动命令改成了 claude-kimi。我还顺手测了 clone 一个 GitHub 仓库然后做代码分析,执行逻辑也没问题。

这种把顶级 Harness 工程的壳子在本地完整跑起来的感觉,太让人兴奋了。
审美测试:K2.6 的 vibe coding 又上了一个台阶
回到审美这块。K2.5 的时候我就说过,Kimi 在 vibe coding 的审美方面一直处在第一梯队。大多数模型做前端,真的一股子 AI 味儿。所以这次我继续测试 K2.6 的审美——没有关窗口,直接在刚才那个 session 里,让 Kimi Code 先写了一份提示词,然后拿到 Kimi 后台,用 K2.6 直接生成。
让它给刚刚部署好的 claude-kimi 做一个单页叙事网站。风格叙事都是它自己构思的,我唯一的原则就是希望有最顶级的审美。然后它生成了一个非常复杂的提示词:

我拿到 Kimi 官网,整个过程一键直出。没有对结果做任何修改,出来的那一刻说实话有点不敢相信——一个非常酷炫的黑客风 landing page,里面甚至还有可以交互的命令行,可以在里面输入命令。很难相信这是 AI 一次性生成的。

claude-kimi 已部署上线:https://dz4xtxmpmn75s.beta-ok.kimi.link
感觉还不错。我让 Kimi Code 换了一个完全不同的叙事风格再试试,提示词如下:

部署地址:https://zdvbfd3lh5xv4.beta-ok.kimi.link
这次 K2.6 的网站模式原生支持视频首屏和各种特效,第一眼就给人一种特别高端的感觉,像是某个拿过设计大奖的工作室作品。而且注意一个关键细节:纯提示词生成,我没有提供任何图片或视频素材,甚至提示词也是 K2.6 自己生成的。真的可以和 frontend slides skills 说拜拜了。总体感觉,K2.6 的审美又上了一个大台阶。
我还把一模一样的提示词在 Cursor 里用 Claude Opus 4.6 测试了一下。后面一个提示词的效果如下。主要是用 Opus 生成,没有图片、视频能力,所以整体完成度差了很多。但二者的风格和审美,你们可以自行对比。
(此处删除了视频加载失败占位块)
多 Agent 模式进化:从并行到协同
之前 K2.5 的时候,我们仔细研究过多 Agent 模式,包括 Kimi、OpenAI、Claude 的一些技术趋势。总体来说,之前的多智能体模式更适合做重复劳动,比如生成几十张表情包——一个人做很费劲,但一群人做很轻松,因为可以并行。但根据群友反馈,K2.6 又改了,这次不仅提升广度,在深度上同样不错。它不仅会开多个 Agent 并行做重复的事,还会随时 fork 不同方向的专业 Agent,去做更专业的事情。
举个例子:我找的是 Anthropic 发布的关于 Harness 的博客,做了个合集,一共 4 篇。提示词还是 Kimi Code 写的,让 Agent Swarm 模式生成 Word、PDF、PPT、Excel。
从日志的创建助手过程就可以看出来,新版的模式更符合我们过去对多智能体的认知——既可以同时并行干重复枯燥的事情,也可以发挥各自特长协同完成一件复杂的事情。



101 页的 PDF、59 页的 Word、5 个 Sheet 的 Excel、30 页的 PPT——一次 Agent Swarm 完成,真的有点离谱。

结果长这个样子,粗看挺酷的,PDF 有点 XXX 橙皮书的感觉了。

Word、Excel、PPT 示例:

一个小发现:Office 文档转技能
在鼓捣上面这些东西的过程中,我发现一个很好玩的功能。去年我分享过,从一个网页把它的 UI 设计扒下来,获取 metadata 然后注入到未来生成的网页里,复刻 UI 设计。但 Kimi 首页这个新功能,还可以复刻文档的主题、风格、排版。这个对很多专业场景非常有用——很多专业场景本身就有固定的模板,但过去用 AI 生成这类专业文档,怎么保留版式是一件挺复杂的事。

我简单测试了一下这个能力:把下面左边这篇 Anthropic 的官方 PDF 的风格沉淀到 Skills 里,然后还原到右边那篇文章里。

目前 Office 文档转技能显示需要花费 20~30 分钟,最后会打包成一个 Skills。转换结果如下图——转换过程中甚至还会生成一些跟范例文档一样风格的图,这真的太酷了。

思考过程:K2.6 的“aha moment”
最后聊一个我觉得特有意思的细节。K2.6 的思考过程跟之前大部分模型都不太一样——看它的思考过程,各种转折,还会“hmm”,有各种“aha moment”。就感觉整个思维特别活跃,不知道跟它原生的 Agent Swarm 一起训练有没有关系。

可能整体的 Token 消耗会更高?但体验下来反而比 K2.5 快。从官方推文来看,每一步决策更精准了,平均步骤数减少了大约 35%。官方博客有一个特别典型的案例:在一个沙箱逃逸任务里,旧模型在一条路径被封锁后还在同一个方向重复尝试了 400 多步,共 716 步没解出来;新模型可以及时切换策略,通过一条完全不同的路径,110 步就拿到了 flag。
我觉得这可能就是 2.6 的特点:思维活跃,此路不通就换条路,而不是像个固执的老头,撞墙了还一直撞。
Kimi Code 给 claude-kimi 写的网站提示词里有一句 slogan:代码不关心你的操作系统,它只关心自由流动。 仔细想想,这句话放在整个 AI 开源生态里也成立。好的技术不应该被锁在某一家公司的围墙里,好的模型也不应该只有付得起 premium 价格的人才能用。
K2.6 用开源的方式把前沿的编程能力释放出来了。Kimi 的 coding plan 会不会被抢爆?我不确定,但我觉得大概率会。这个时代最大的红利,不是拥有最贵的工具,而是保持好奇心,去试每一个新东西。就像卡兹克大佬 AIFUT 的 slogan:永远对世界保持好奇。
在云栈社区里,我们一直关注 AI Agent 和开源工具的最新实践,欢迎一起交流探讨。