找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2579

积分

0

好友

361

主题
发表于 4 天前 | 查看: 17| 回复: 0

“真正决定企业未来的转折点,正在发生,不是远方的AGI,而是当下的智能体。”

谷歌在年初预测,2026年将成为AI Agent的爆发之年。一个关键趋势是,AI正从单纯回答问题,转向理解目标、制定计划并跨系统执行行动。这意味着未来的Agent将不再只是对话工具,而是能完成复杂任务和交付成果的生产力引擎。

在中国,AI Agent的发展大致可划分为两个阶段。前一阶段侧重于对话和搜索,各类AI助手应用层出不穷,但未分出明显高下。从用户量看,巨头代表如抖音豆包、腾讯元宝和阿里千问,创业公司代表如DeepSeek和Kimi,本质上都在争夺流量入口和用户习惯。

进入2025年末至2026年初的第二阶段,AI Agent的发展路径呈现显著分化。各家依据自身战略与资源,瞄准了不同的价值方向。

豆包持续深化在语音对话、图片与视频生成领域的娱乐化应用;千问依托阿里生态优势,聚焦生活服务,扮演“行政管家”角色;Kimi则将重心放在生产力方向,通过自研Agent模型推动AI与工作流的深度融合。

回到谷歌的论断,从豆包、千问和Kimi身上已能看到端倪。差异化竞争的背后,行业正逐渐达成一个共识:AI Agent的价值,最终必须由其解决实际问题的能力来定义。

AI Agent机器人示意图

输入决定交付

探究豆包、千问与Kimi做出不同选择的原因,或许要回到一个基本原理:输入决定输出的质量。

在AI Agent时代,这一法则被赋予新内涵。Agent的输出不仅依赖于用户的简单指令,更取决于其对任务上下文的深度理解、对可用工具的精确调用,以及对多步骤流程的可靠规划。

卡通AI Agent工作场景

从输入与输出的视角分析,豆包的输入场景根植于字节的娱乐与内容生态。其输入往往是开放、多模态的创意灵感——一段文字、一张图片、一句语音,甚至只是一个模糊的想法。这种输入的不确定性和娱乐导向,要求模型具备强大的联想与内容生成能力。

豆包更倾向于将任务边界限定在创意内容生成领域,不追求解决确切问题,而是激发创意过程。其核心指标是内容的新颖性、趣味性和传播度。交付结果通常是一个短视频脚本、一张趣味图片或一段配音,价值在于激发用户的二次创作和社交分享。例如,在抖音流行的“模拟站姐生图”、“我想要占据你丝滑转场”等玩法均源自豆包,完成了从AI生成到用户交互的接力。

千问打造的是以服务调度为中心的输入输出模式。背靠阿里覆盖衣食住行的成熟生态,千问的输入是结构化的生活服务需求,例如“订一张飞往上海的机票”或“买一杯奶茶”。输入中天然包含了时间、地点、商品、服务等要素。

千问的输入具有明确指向性,Agent的任务边界被划定在阿里生态可触及的服务范围内。其核心是将自然语言指令转化为准确的API调用,成功指标是服务的完成率、效率和用户体验。最终交付的是已完成的服务结果,如一张出票订单、一份外卖或一条行程规划。千问的价值在于聚合阿里系流量,成为服务生态的统一智能入口,其未来边界取决于连接生态的深度与对外互动能力。

Kimi的方向代表了创业公司的一种战略取舍:不涉足生活娱乐,也不做多模态生成,而是专注于深入研究、数据分析、PPT制作、网站开发等偏生产力与复杂任务的功能。这些任务通常需要长程规划、复杂工具调用,并具备高经济价值潜力。

按照上述逻辑,Kimi Agent的输入是复杂的专业工作流。用户常提交数十万字的行业文档、一个多步骤的项目需求,或一套待分析的数据集。此类输入具备超长上下文、高信息密度和强逻辑性的特点。

当Kimi将任务边界拓展至需要深度规划、多工具调用和长链条推理的工作流时,其成功标准就变为任务的完整交付、专业度与效率的提升。结果交付的是直接可用的工作成果,如一份结构完整的行业报告或一套数据分析图表。这与OpenAI的Deep Research思路类似,核心价值在于能直接替代部分重复性、低创造性的专业劳动。

Agent的生产力向

不久前,豆包因发布搭载AI助手版的手机引发热议,千问在进一步打通淘系生态后也刷屏不断。因此,我们想更多探讨一下作为创业公司代表的Kimi。

当昔日的“AI六小虎”中智谱、MimiMax相继在港股上市后,外界将疑问抛给了Kimi。在创始人杨植麟发布的内部信中,他回应称已完成约合35亿元的C轮融资,当前现金持有量超过100亿元,短期不急于上市。K3模型正进一步扩展规模,并在产品和商业化上聚焦于Agent。

回顾2025年,Kimi在年初转向基础模型和Agent研究后,虽保持低调但收获了更多成果。其以“Token效率(Token Efficiency)+长上下文(Long Context)”为核心技术路径,致力于打造具备主动规划与复杂任务执行能力的Agent,并通过算法与架构创新突破现有智能上限。

Token效率和长上下文是Kimi的两个关键技术方向。为提升训练效率,Kimi首次在超大规模模型预训练中验证了二阶优化器Muon的价值。相比行业沿用十多年的传统Adam优化器,Muon实现了约2倍的Token效率提升,相当于用同等资源训练出更高智能水平的模型。

行业专家评价:“现在还能在optimizer这样fundamental的领域,有这么大的进展,真是让人吃惊。”作为模型架构层2025年的重大进展之一,Muon优化器后续已被包括智谱GLM和DeepSeek Engram在内的中国开源模型陆续采用,展现了中国开源生态的活力。

在拓展上下文能力方面,Kimi提出了基于线性注意力改进的“Kimi Linear”架构。该架构首次在长上下文任务上性能超越全注意力Transformer,并在百万级上下文长度下实现6–10倍的端到端速度提升,同时保持更强的记忆与表达能力。

杨植麟提到,Kimi的K2模型是“中国第一个Agent模型”。通过K2 Thinking的升级,Kimi能够完成复杂的工具调用并协助解决高难度问题。在实战中,Kimi K2可执行两百多个步骤的复杂任务,已能帮助用户完成一系列高难度工作,展现出与全球头部Agent模型竞争的能力。

Kimi的深度研究功能更适合专业用户使用。用户无需提供前情提要,直接列出研究要求和可视化需求即可。Kimi能快速理解用户意图,并进一步确认、明晰要点。随后,它会自行调用浏览器工具,边搜索边分析,最终生成一份详细的研究报告和排版好的可视化网页。

基于深度研究、PPT制作和通用Agent模式(如OK Computer中的数据分析)等能力,Kimi开启了Agent能力的商业化,主要采用订阅制。不同等级会员可使用不同次数的Agent能力。据Kimi全员信称,其全球付费用户数月增速达170%,这在国内普遍免费的大背景下,迈出了艰难的第一步。

在知名风投机构a16z联合创始人Marc Andreessen的开年演讲中,他特别提到来自中国的Kimi模型是领先的开源模型之一。从基准测试看,其已基本复现了GPT-5的推理能力。除了全球范围内的“超新星”DeepSeek外,Qwen、字节、Kimi等也具备强大竞争力,而Kimi是其中唯一的创业公司。

智能的价值

从豆包到Kimi,这三家玩家对AI Agent路径的选择,不仅仅是产品功能的差异,更是对“什么是Agent核心价值”这一问题的不同回答。

不同的理解决定了他们未来的竞争维度。

豆包定义了如何用Agent处理非结构化创意输入,交付情绪与互动价值。这要求模型具备强大的多模态生成与风格模仿能力。其生态是内容创作与分发的流量网络,壁垒在于能否持续产出爆款内容并激发用户生成内容(UGC)。

千问定义了如何用Agent理解结构化商业意图,交付交易与效率价值。这要求模型具备极高的意图识别准确率与API调用可靠性。千问依赖于阿里的商业操作系统,其壁垒在于对支付、物流、本地生活等服务的无缝整合深度。

Kimi正试图定义如何用Agent驾驭复杂专业任务,交付生产力与解决方案价值。这需要模型拥有深度的逻辑推理、任务规划与长程记忆能力。Kimi通过构建专业场景下“模型+工具+工作流”的标准,加强了对垂直行业复杂需求的理解与满足能力,吸引的是付费意愿强的专业用户和组织。

但归结到一点,豆包、千问、Kimi以及更多公司,都在定义和量化不同形态的智能价值,并将其产品化。

复古电脑显示AI Agent

新的阶段,AI Agent让智能的价值得到进一步放大。

第一步是价值的Token化。各家将模糊的智能能力拆解为可标准计量的最小单元。这如同为电力配置千瓦时单位,使智能的消耗和计价成为可能,为商业化奠定了基础。

接下来是价值的流通化。当智能价值被量化后,便能在生态中自由组合与流通,Agent成为智能价值的交易接口。典型如千问,流通的是交易意图和服务,Token的价值在电商、本地生活等多个场景中流转倍增。

最后是价值重组,也是谷歌提到的从工具层到工作与组织层的深化。

如果高性价比的智能也能像水电般随取随用,企业的底层逻辑可能被改写。公司无需招聘专家团队,只需通过接入专业垂类Agent,就能获得该领域的顶级能力,从而突破原有的能力壁垒。创新或许不仅限于内部生发,也可来自于对外部智能服务的创造性组合。

正如a16z联合创始人所言,我们正目睹一种“超通缩”的智能单位成本,与一种“超通胀”的智能应用需求历史性地相遇。AI Agent,恰好是创造智能化价值并影响价值流向的关键。

探索更多关于人工智能与Agent技术的前沿讨论,欢迎访问云栈社区




上一篇:2026外贸获客指南:抓住GEO优化窗口期,实现AI零点击转化
下一篇:Open Responses:面向智能体时代的开放推理API新标准
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-24 01:45 , Processed in 0.354560 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表