云栈社区»论坛 › 技术文档「 Note & Doc 」 › Kimi 2.6 Agent实战：Windows上跑通Claude Code，审美与多智能体 ...

发回帖发新帖

5840 积分	0 好友	727 主题

发消息

Kimi 2.6 Agent实战：Windows上跑通Claude Code，审美与多智能体进化

发表于 2026-4-22 17:38:30 | 查看: 397| 回复: 0

Kimi K2.6 发布并开源了，代码和 Agent 能力大幅提升。这次国产模型又往前迈了一大步，龙虾终于可以换更好的替代品了。

Claude Code 的源码前不久泄露了，这事想必大家都听说了。不过因为缺了一些东西，想在本地方便地跑起来并不容易——至少我拿最近几个国产大模型试了一遍，基本全军覆没。

上周看到群友在夸 K2.6 code preview，好不容易等到正式发布，可一开始没有申请体验资格，我第一时间还是测了这个 case。

聊天界面截图，包含KIMI Code界面和熊猫头表情包，对话显示“kimi 这模型上线后估计要卖爆”

我同时开了两个 Agent：一个跑 Kimi Code，另一个跑 Claude Code，但底层用的都是 K2.6 code 模型。任务很简单——在 Windows 上把泄露的 Claude Code 源码完整部署起来。

都知道 Kimi Code 的壳肯定不如 Claude Code 精致，但出乎意料的是，这次 Kimi Code 先完成了（当然，仅一次测试，可能随机性比较大）。整个过程大概花了 3 个小时。

调试界面截图，左侧为技术文档和代码片段，右侧为PowerShell终端显示Claude Code CLI信息

两个 CLI Agent 总计消耗了 Allegretto 订阅一周用量的 13%。之前我用其他国产模型在 Windows 下部署这份泄露代码都没成功过，确实难。

用量界面截图，显示本周用量13%、频限明细47%、Allegretto会员和K2.6-code-preview模型权限

启动和功能调用都正常。底层用 Kimi Code 的认证，启动命令改成了 claude-kimi。我还顺手测了 clone 一个 GitHub 仓库然后做代码分析，执行逻辑也没问题。

终端截图，显示Claude Code CLI欢迎页面，包含ClawTeam原理分析和Agent架构

这种把顶级 Harness 工程的壳子在本地完整跑起来的感觉，太让人兴奋了。

审美测试：K2.6 的 vibe coding 又上了一个台阶

回到审美这块。K2.5 的时候我就说过，Kimi 在 vibe coding 的审美方面一直处在第一梯队。大多数模型做前端，真的一股子 AI 味儿。所以这次我继续测试 K2.6 的审美——没有关窗口，直接在刚才那个 session 里，让 Kimi Code 先写了一份提示词，然后拿到 Kimi 后台，用 K2.6 直接生成。

让它给刚刚部署好的 claude-kimi 做一个单页叙事网站。风格叙事都是它自己构思的，我唯一的原则就是希望有最顶级的审美。然后它生成了一个非常复杂的提示词：

网站设计描述截图，包含Hero、敌区、字体、页面结构等模块的详细参数

我拿到 Kimi 官网，整个过程一键直出。没有对结果做任何修改，出来的那一刻说实话有点不敢相信——一个非常酷炫的黑客风 landing page，里面甚至还有可以交互的命令行，可以在里面输入命令。很难相信这是 AI 一次性生成的。

分屏截图，左侧为技术栈说明（React、TypeScript、Vite等），右侧为暗色服务器机房走廊场景

claude-kimi 已部署上线：https://dz4xtxmpmn75s.beta-ok.kimi.link

感觉还不错。我让 Kimi Code 换了一个完全不同的叙事风格再试试，提示词如下：

另一版本网站设计描述截图，包含定位、字体、页面结构、The Archive等章节

部署地址：https://zdvbfd3lh5xv4.beta-ok.kimi.link

这次 K2.6 的网站模式原生支持视频首屏和各种特效，第一眼就给人一种特别高端的感觉，像是某个拿过设计大奖的工作室作品。而且注意一个关键细节：纯提示词生成，我没有提供任何图片或视频素材，甚至提示词也是 K2.6 自己生成的。真的可以和 frontend slides skills 说拜拜了。总体感觉，K2.6 的审美又上了一个大台阶。

我还把一模一样的提示词在 Cursor 里用 Claude Opus 4.6 测试了一下。后面一个提示词的效果如下。主要是用 Opus 生成，没有图片、视频能力，所以整体完成度差了很多。但二者的风格和审美，你们可以自行对比。

（此处删除了视频加载失败占位块）

多 Agent 模式进化：从并行到协同

之前 K2.5 的时候，我们仔细研究过多 Agent 模式，包括 Kimi、OpenAI、Claude 的一些技术趋势。总体来说，之前的多智能体模式更适合做重复劳动，比如生成几十张表情包——一个人做很费劲，但一群人做很轻松，因为可以并行。但根据群友反馈，K2.6 又改了，这次不仅提升广度，在深度上同样不错。它不仅会开多个 Agent 并行做重复的事，还会随时 fork 不同方向的专业 Agent，去做更专业的事情。

举个例子：我找的是 Anthropic 发布的关于 Harness 的博客，做了个合集，一共 4 篇。提示词还是 Kimi Code 写的，让 Agent Swarm 模式生成 Word、PDF、PPT、Excel。

从日志的创建助手过程就可以看出来，新版的模式更符合我们过去对多智能体的认知——既可以同时并行干重复枯燥的事情，也可以发挥各自特长协同完成一件复杂的事情。

Agent管理界面截图，显示“创建助手”列表，包含架构分析Agent和知识提炼Agent

多窗口并列界面，左侧任务管理面板显示PDF白皮书Writer任务及Agent集群

任务执行状态界面，显示PDF组装Agent和Excel创建Agent

101 页的 PDF、59 页的 Word、5 个 Sheet 的 Excel、30 页的 PPT——一次 Agent Swarm 完成，真的有点离谱。

文档结构说明图，展示PDF白皮书（101页）、Word手册（~50页）、Excel矩阵（5 Sheets）和PPT演示（30页）的目录要点

结果长这个样子，粗看挺酷的，PDF 有点 XXX 橙皮书的感觉了。

文档阅读界面，显示“Agent Harness 设计方法论”章节内容及目录

Word、Excel、PPT 示例：

三张并列截图，左侧英文技术文档，中间Excel矩阵，右侧PPT幻灯片

一个小发现：Office 文档转技能

在鼓捣上面这些东西的过程中，我发现一个很好玩的功能。去年我分享过，从一个网页把它的 UI 设计扒下来，获取 metadata 然后注入到未来生成的网页里，复刻 UI 设计。但 Kimi 首页这个新功能，还可以复刻文档的主题、风格、排版。这个对很多专业场景非常有用——很多专业场景本身就有固定的模板，但过去用 AI 生成这类专业文档，怎么保留版式是一件挺复杂的事。

KIMI工具界面，左侧功能列表包含“Office 文档转技能”选项并高亮，右侧为功能详情弹窗

我简单测试了一下这个能力：把下面左边这篇 Anthropic 的官方 PDF 的风格沉淀到 Skills 里，然后还原到右边那篇文章里。

PDF阅读器界面，左侧缩略图，右侧显示两份文档封面页

目前 Office 文档转技能显示需要花费 20~30 分钟，最后会打包成一个 Skills。转换结果如下图——转换过程中甚至还会生成一些跟范例文档一样风格的图，这真的太酷了。

三张并列文档截图，左侧经济研究报告，中间报告正文含图表，右侧报告封面

思考过程：K2.6 的“aha moment”

最后聊一个我觉得特有意思的细节。K2.6 的思考过程跟之前大部分模型都不太一样——看它的思考过程，各种转折，还会“hmm”，有各种“aha moment”。就感觉整个思维特别活跃，不知道跟它原生的 Agent Swarm 一起训练有没有关系。

代码调试截图，包含技术分析文字和红色高亮标注

可能整体的 Token 消耗会更高？但体验下来反而比 K2.5 快。从官方推文来看，每一步决策更精准了，平均步骤数减少了大约 35%。官方博客有一个特别典型的案例：在一个沙箱逃逸任务里，旧模型在一条路径被封锁后还在同一个方向重复尝试了 400 多步，共 716 步没解出来；新模型可以及时切换策略，通过一条完全不同的路径，110 步就拿到了 flag。

我觉得这可能就是 2.6 的特点：思维活跃，此路不通就换条路，而不是像个固执的老头，撞墙了还一直撞。

Kimi Code 给 claude-kimi 写的网站提示词里有一句 slogan：代码不关心你的操作系统，它只关心自由流动。 仔细想想，这句话放在整个 AI 开源生态里也成立。好的技术不应该被锁在某一家公司的围墙里，好的模型也不应该只有付得起 premium 价格的人才能用。

K2.6 用开源的方式把前沿的编程能力释放出来了。Kimi 的 coding plan 会不会被抢爆？我不确定，但我觉得大概率会。这个时代最大的红利，不是拥有最贵的工具，而是保持好奇心，去试每一个新东西。就像卡兹克大佬 AIFUT 的 slogan：永远对世界保持好奇。

在云栈社区里，我们一直关注 AI Agent 和开源工具的最新实践，欢迎一起交流探讨。

上一篇：爱奇艺AI艺人库引争议，影视AIGC重塑行业规则
下一篇：Hermes Agent + Kimi K2.6 实战：7x24h多智能体研发军团从零搭建

Kimi, Agent, ClaudeCode, 多智能体, 前端生成