找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5358

积分

0

好友

707

主题
发表于 昨天 17:38 | 查看: 8| 回复: 0

Kimi K2.6 发布并开源了,代码和 Agent 能力大幅提升。这次国产模型又往前迈了一大步,龙虾终于可以换更好的替代品了。

Claude Code 的源码前不久泄露了,这事想必大家都听说了。不过因为缺了一些东西,想在本地方便地跑起来并不容易——至少我拿最近几个国产大模型试了一遍,基本全军覆没。

上周看到群友在夸 K2.6 code preview,好不容易等到正式发布,可一开始没有申请体验资格,我第一时间还是测了这个 case。

聊天界面截图,包含KIMI Code界面和熊猫头表情包,对话显示“kimi 这模型上线后估计要卖爆”

我同时开了两个 Agent:一个跑 Kimi Code,另一个跑 Claude Code,但底层用的都是 K2.6 code 模型。任务很简单——在 Windows 上把泄露的 Claude Code 源码完整部署起来。

都知道 Kimi Code 的壳肯定不如 Claude Code 精致,但出乎意料的是,这次 Kimi Code 先完成了(当然,仅一次测试,可能随机性比较大)。整个过程大概花了 3 个小时。

调试界面截图,左侧为技术文档和代码片段,右侧为PowerShell终端显示Claude Code CLI信息

两个 CLI Agent 总计消耗了 Allegretto 订阅一周用量的 13%。之前我用其他国产模型在 Windows 下部署这份泄露代码都没成功过,确实难。

用量界面截图,显示本周用量13%、频限明细47%、Allegretto会员和K2.6-code-preview模型权限

启动和功能调用都正常。底层用 Kimi Code 的认证,启动命令改成了 claude-kimi。我还顺手测了 clone 一个 GitHub 仓库然后做代码分析,执行逻辑也没问题。

终端截图,显示Claude Code CLI欢迎页面,包含ClawTeam原理分析和Agent架构

这种把顶级 Harness 工程的壳子在本地完整跑起来的感觉,太让人兴奋了。

审美测试:K2.6 的 vibe coding 又上了一个台阶

回到审美这块。K2.5 的时候我就说过,Kimi 在 vibe coding 的审美方面一直处在第一梯队。大多数模型做前端,真的一股子 AI 味儿。所以这次我继续测试 K2.6 的审美——没有关窗口,直接在刚才那个 session 里,让 Kimi Code 先写了一份提示词,然后拿到 Kimi 后台,用 K2.6 直接生成。

让它给刚刚部署好的 claude-kimi 做一个单页叙事网站。风格叙事都是它自己构思的,我唯一的原则就是希望有最顶级的审美。然后它生成了一个非常复杂的提示词:

网站设计描述截图,包含Hero、敌区、字体、页面结构等模块的详细参数

我拿到 Kimi 官网,整个过程一键直出。没有对结果做任何修改,出来的那一刻说实话有点不敢相信——一个非常酷炫的黑客风 landing page,里面甚至还有可以交互的命令行,可以在里面输入命令。很难相信这是 AI 一次性生成的。

分屏截图,左侧为技术栈说明(React、TypeScript、Vite等),右侧为暗色服务器机房走廊场景

claude-kimi 已部署上线:https://dz4xtxmpmn75s.beta-ok.kimi.link

感觉还不错。我让 Kimi Code 换了一个完全不同的叙事风格再试试,提示词如下:

另一版本网站设计描述截图,包含定位、字体、页面结构、The Archive等章节

部署地址:https://zdvbfd3lh5xv4.beta-ok.kimi.link

这次 K2.6 的网站模式原生支持视频首屏和各种特效,第一眼就给人一种特别高端的感觉,像是某个拿过设计大奖的工作室作品。而且注意一个关键细节:纯提示词生成,我没有提供任何图片或视频素材,甚至提示词也是 K2.6 自己生成的。真的可以和 frontend slides skills 说拜拜了。总体感觉,K2.6 的审美又上了一个大台阶。

我还把一模一样的提示词在 Cursor 里用 Claude Opus 4.6 测试了一下。后面一个提示词的效果如下。主要是用 Opus 生成,没有图片、视频能力,所以整体完成度差了很多。但二者的风格和审美,你们可以自行对比。

(此处删除了视频加载失败占位块)

多 Agent 模式进化:从并行到协同

之前 K2.5 的时候,我们仔细研究过多 Agent 模式,包括 Kimi、OpenAI、Claude 的一些技术趋势。总体来说,之前的多智能体模式更适合做重复劳动,比如生成几十张表情包——一个人做很费劲,但一群人做很轻松,因为可以并行。但根据群友反馈,K2.6 又改了,这次不仅提升广度,在深度上同样不错。它不仅会开多个 Agent 并行做重复的事,还会随时 fork 不同方向的专业 Agent,去做更专业的事情。

举个例子:我找的是 Anthropic 发布的关于 Harness 的博客,做了个合集,一共 4 篇。提示词还是 Kimi Code 写的,让 Agent Swarm 模式生成 Word、PDF、PPT、Excel。

从日志的创建助手过程就可以看出来,新版的模式更符合我们过去对多智能体的认知——既可以同时并行干重复枯燥的事情,也可以发挥各自特长协同完成一件复杂的事情。

Agent管理界面截图,显示“创建助手”列表,包含架构分析Agent和知识提炼Agent

多窗口并列界面,左侧任务管理面板显示PDF白皮书Writer任务及Agent集群

任务执行状态界面,显示PDF组装Agent和Excel创建Agent

101 页的 PDF、59 页的 Word、5 个 Sheet 的 Excel、30 页的 PPT——一次 Agent Swarm 完成,真的有点离谱。

文档结构说明图,展示PDF白皮书(101页)、Word手册(~50页)、Excel矩阵(5 Sheets)和PPT演示(30页)的目录要点

结果长这个样子,粗看挺酷的,PDF 有点 XXX 橙皮书的感觉了。

文档阅读界面,显示“Agent Harness 设计方法论”章节内容及目录

Word、Excel、PPT 示例:

三张并列截图,左侧英文技术文档,中间Excel矩阵,右侧PPT幻灯片

一个小发现:Office 文档转技能

在鼓捣上面这些东西的过程中,我发现一个很好玩的功能。去年我分享过,从一个网页把它的 UI 设计扒下来,获取 metadata 然后注入到未来生成的网页里,复刻 UI 设计。但 Kimi 首页这个新功能,还可以复刻文档的主题、风格、排版。这个对很多专业场景非常有用——很多专业场景本身就有固定的模板,但过去用 AI 生成这类专业文档,怎么保留版式是一件挺复杂的事。

KIMI工具界面,左侧功能列表包含“Office 文档转技能”选项并高亮,右侧为功能详情弹窗

我简单测试了一下这个能力:把下面左边这篇 Anthropic 的官方 PDF 的风格沉淀到 Skills 里,然后还原到右边那篇文章里。

PDF阅读器界面,左侧缩略图,右侧显示两份文档封面页

目前 Office 文档转技能显示需要花费 20~30 分钟,最后会打包成一个 Skills。转换结果如下图——转换过程中甚至还会生成一些跟范例文档一样风格的图,这真的太酷了。

三张并列文档截图,左侧经济研究报告,中间报告正文含图表,右侧报告封面

思考过程:K2.6 的“aha moment”

最后聊一个我觉得特有意思的细节。K2.6 的思考过程跟之前大部分模型都不太一样——看它的思考过程,各种转折,还会“hmm”,有各种“aha moment”。就感觉整个思维特别活跃,不知道跟它原生的 Agent Swarm 一起训练有没有关系。

代码调试截图,包含技术分析文字和红色高亮标注

可能整体的 Token 消耗会更高?但体验下来反而比 K2.5 快。从官方推文来看,每一步决策更精准了,平均步骤数减少了大约 35%。官方博客有一个特别典型的案例:在一个沙箱逃逸任务里,旧模型在一条路径被封锁后还在同一个方向重复尝试了 400 多步,共 716 步没解出来;新模型可以及时切换策略,通过一条完全不同的路径,110 步就拿到了 flag。

我觉得这可能就是 2.6 的特点:思维活跃,此路不通就换条路,而不是像个固执的老头,撞墙了还一直撞。

Kimi Code 给 claude-kimi 写的网站提示词里有一句 slogan:代码不关心你的操作系统,它只关心自由流动。 仔细想想,这句话放在整个 AI 开源生态里也成立。好的技术不应该被锁在某一家公司的围墙里,好的模型也不应该只有付得起 premium 价格的人才能用。

K2.6 用开源的方式把前沿的编程能力释放出来了。Kimi 的 coding plan 会不会被抢爆?我不确定,但我觉得大概率会。这个时代最大的红利,不是拥有最贵的工具,而是保持好奇心,去试每一个新东西。就像卡兹克大佬 AIFUT 的 slogan:永远对世界保持好奇。

云栈社区里,我们一直关注 AI Agent 和开源工具的最新实践,欢迎一起交流探讨。




上一篇:爱奇艺AI艺人库引争议,影视AIGC重塑行业规则
下一篇:Hermes Agent + Kimi K2.6 实战:7x24h多智能体研发军团从零搭建
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-23 06:42 , Processed in 0.929009 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表