找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3029

积分

0

好友

417

主题
发表于 昨天 04:09 | 查看: 1| 回复: 0

融合古典迷宫与未来科技的场景,寓意AI时代的探索与变革

旧场景的验证,新技术的竞赛。

2026年,中国AI市场的竞争注定会更加激烈。

最重量级的玩家已准备就绪。阿里对“通义千问”的战略级投入将在今年展现得更加淋漓尽致,声势浩大的用户补贴只是一个开始;腾讯的“元宝红包”同样不会是其唯一的重大动作。

字节跳动则是一个难缠的对手,它已经占据了AI to C应用的一线位置,手握巨大流量,“豆包手机”也不会是它对终端边界探索的终点。

如果说前几年,大厂的AI业务还多聚焦于模型层的“阳春白雪”,尚有观望和试错的空间,那么面对“豆包”高企的日活用户,2026年已成为大厂捍卫其“大厂”地位、争夺AI To C市场的最后关键窗口期。这场战役的重要程度,绝不亚于我们曾经历过的任何一场互联网巨头间的战争。

对于“中厂”而言,随着智谱AI和MiniMax的港股IPO推进、月之暗面与阶跃星辰的新一轮融资落定,“AI六小虎”的故事暂告一段落。全力冲刺通用人工智能(AGI)或许仍是远期命题,但实现自我造血已迫在眉睫。它们必须找到差异化的商业路径。正如一位六小虎的高管所言:不要贪大盲目IPO,二级市场的严苛审视会立刻反映在股价上。

然而,“目前没有商业模式是成熟的,还需要经过几年的探索。”一位一线美元基金的合伙人如是说。

商业模式的分化,必然伴随着组织形态的分化。一位大模型初创公司的融资负责人一口气列举了5种主流模式:ToC的订阅与广告、ToB的API售卖、ToB/G的定制化、按效果收费、软硬件一体。每种模式都对应着不同的市场选择,例如,做ToC的几乎必须出海,做ToB的则必须精通“打单”……

不过,最活色生香、最令人期待的领域,仍是创业公司扎堆的AI应用层。每个人都想成为下一个ARR(年度经常性收入)过亿美元、被巨头重金收购的宠儿,但这里也充满了最大的不确定性。

难以琢磨,却充满魔力。

关于模型技术的迭代、商业化落地以及不同玩家的处境,《智能涌现》访谈了十几位身处一线的创业者、投资人与大厂员工,总结了2026年AI行业的九大关键命题。

字节:守住优势,追击AI世界第一梯队

象征攀登AI技术高峰的插画
图源:AI生成

前字节员工:AI入口的最佳形态尚未确定

“豆包”做得最对的一个决策,是在早期阶段就确立了多模态为核心能力,实现了AI能力的平权化。在2025年,它也抓住了最好的时机实现了用户增长。

2025年,字节完成的一个重要里程碑是,通过引入吴永辉等世界顶尖人才,逐渐补全了一流模型人才的储备,在基础模型层已稳居国内第一梯队。

但2026年,随着AI助手和模型层竞争白热化,如何留住这些顶尖人才,将是最核心的命题

某大厂战略人士:今年最大的挑战,是联动线下服务

2025年,“豆包”最勇敢的决策是推出“豆包手机”。尽管此举注定会引来其他大厂的围攻,但它成功搅动了移动互联网与手机厂商的现有利益格局,迫使所有玩家加速行动。

展望未来,“豆包”面临的长期挑战在于,如何在保持AI模型能力领先的同时,将AI助手与普通用户的真实生活——尤其是电商、外卖这类线下服务——更紧密地连接起来。字节虽有布局,组织上也比其他大厂更年轻、包袱更少,但如何实现更高效的内部协同,依然是个不小的难题

阿里:再造新的AI To C入口

象征AI模型亲切服务大众的插画
图源:AI生成

某“通义千问”员工:不止是对外入口,更是底层AI能力平台

“千问”是阿里集全集团之力打造的C端AI入口。从产品路线上,我们主打差异化。因为“亲切、亲民”的路线已被竞品占据用户心智,我们选择以差异化的办事、办公场景切入,走专业路线,但长期目标仍是成为主流AI入口。

未来,“千问”不仅是对外的AI入口,也将为阿里众多业务提供底层的AI能力。

2026年,我们的挑战在于,阿里的业务体系庞杂,行业差异巨大。“千问”作为相对独立的技术团队,要深刻理解内部各业务单元对AI能力的真实诉求并不容易,如何实现更好的协同是未来的关键。

某大厂战略人士:2026年,才是大厂“ChatGPT之战”真正开打的一年

阿里今年能从“夸克”切换到“千问”,并快速发力,背后是强大的组织能力在支撑。

今年会是大厂真正开打“ChatGPT之战”的一年,因为一条主线仍在持续:只要模型能力持续提升,释放出新功能,就会不断反哺业务,创造新的机会。

从竞争格局看,虽然市场已出现日活过亿的产品,但市场远未饱和,这正是“千问”敢于此时发力的原因。目前,各家大厂的通用AI助手产品同质化程度较高,真正的差异在于谁能更快迭代、谁更能把握用户需求并进行长期运营。AI助手市场仍有巨大的增量空间。

前阿里员工:用组织变革换取决策速度

AI时代给了大厂一个重新定义入口的机会。传统的搜索、社交、电商入口格局已定,AI助手有可能成为新的流量入口与推荐网络。

问题在于,这个机会窗口可能很短。“千问”C端事业群的推出,某种程度上是阿里在用组织变革来换取决策速度——与其在内部缓慢协调,不如直接推出新产品,用市场反馈来快速验证。

腾讯:AI应用与模型继续“补课”

象征AI模型勤奋学习与工作的插画
图源:AI生成

前“元宝”员工:DeepSeek再次印证“模型即产品”的重要性

事实上,在接入DeepSeek之前,“元宝”团队就已明确“模型即产品”的重要性,DeepSeek的成功更强化了这一共识。过去一年,“元宝”比较聚焦于模型能力的提升,强化产品与模型的深度整合。

另外,“元宝”早期就定下了聚焦高知人群的差异化路线。一是这部分用户对体验和效果要求更高;二是他们作为AI领域的早期尝鲜者和意见领袖,其使用习惯能影响周围人群,形成示范效应。

“元宝”成员:“元宝”需要摆脱DeepSeek依赖

目前,“混元”模型在市场上尚未建立绝对优势。“元宝”提供的搜索服务,一部分基于“混元”,一部分基于DeepSeek。但截至2025年底,大多数用户仍选择DeepSeek作为默认模型

近期,TEG(技术工程事业群)的搜推部门合并到了“元宝”的搜推团队。此前,TEG搜推负责基于“混元”的搜索链路,“元宝”搜推负责基于DeepSeek的链路。

此举的意义,一方面在于提高内部合作效率。另一方面,我猜测未来“元宝”的搜索会对模型进行整合,内部可能不再区分基于谁的搜索,只存在统一的“元宝搜索”

某大厂战略人士:关键要理清微信与“元宝”的战略定位

相比行业内其他玩家的快速迭代,腾讯的节奏相对谨慎。例如,“混元”的策略可能是不在基础模型层面做正面竞争,而是聚焦智能体(Agent)模型等差异化方向。接下来,腾讯需要在自研模型能力上拿出更有说服力的成果。

微信迟迟未将AI能力深度集成,也是因为国民级应用面临的隐私和安全问题更为复杂,难以在短时间内妥善解决。通过“元宝”等新产品试水,本质上是希望加速产品形态的创新尝试,而不影响微信原有用户的体验。

2026年,腾讯更需要解决的关键问题,可能是理顺“元宝”与微信的战略定位与协同关系,从而更好地发挥其在产品层面的传统优势。

模型商业化:赚“高质量”的钱

象征价值与重量不对等的天平插画
图源:AI生成

某模型初创公司高管:售卖模型API,只能作为短期补充

大模型主流的商业模式有5种:ToC的订阅和广告、ToB的API售卖、ToB/G的定制化、按效果付费、以及走向终端侧的软硬一体。

选择ToC订阅的厂商,基本都选择了出海,因为国内用户付费意愿仍待培养;售卖API的模式,本质上是云服务的延伸,未来云厂商一定会将API价格压得很低,独立模型厂商很难借此实现规模化,因此API只能作为短期商业化的补充手段

至于定制化,市场上一种论调是,大模型的泛化能力可以改变原有重交付的模式。但在国内,不仅需要能交付的技术能力,人脉与商务资源同样重要

对初创公司来说,按效果付费和做软硬一体都有机会。Physical AI(物理人工智能)想象空间很大,未来智能终端有望成为新的流量入口。但这两种模式都对初创公司提出了高要求。按效果付费的前提是模型能力足够强。做软硬一体交付,则要求公司拥有丰富且无短板的多模态模型矩阵,以及团队具备资深的端云协同交付经验

某模型初创公司成员:模型迭代,应跟随客户需求而非OpenAI

2023年以来,我觉得赛道上很多模型公司都有“OpenAI情结”,自称要做“中国的OpenAI”,产品矩阵也强对标OpenAI。

但到了2025年,提“中国OpenAI”的公司变少了,提Anthropic的变多了。一个重要原因是,大家发现手上的资金和算力卡不足以支撑像OpenAI那样全面铺开的产品矩阵。资源有限的情况下,必须有所取舍。

Anthropic已经证明,强大的推理与代码能力有明确的市场和付费意愿。因此,不少厂商从2025年开始都将模型的迭代重点转移到这两方面。

我相信未来不同模型厂商的能力,会根据自身资源、优势以及下游客户的需求,产生进一步分化

某一线美元基金合伙人:目前模型的商业模式都不够成熟

在产品层面,AI时代的产品形态尚未完全定型,原因在于模型能力本身还在快速演进。比如视频模型的一致性、理解能力都还在发展中。这些能力成熟后,究竟能催生什么功能、落地哪些场景,大家仍在探索。

今天,像聊天机器人这类产品,普遍采用订阅制收费。但这只是其中一种形态。OpenAI自身也在探索,ChatGPT是否要采用更高效的广告模式来吸引更多用户,而不是全部依赖订阅。

所以,目前没有哪一种商业模式是成熟的,都还需要经过几年时间的探索与验证。

找场景:在垂直、细分领域“掘金”

象征在垂直领域挖掘价值的矿工插画
图源:AI生成

极致上下文CEO廖谦:创业公司应切入垂直场景,做端到端服务

我不认为通用智能体(Agent)会一统天下。在处理用户问题时,不同问题的交互形态、信息搜集方式完全不同。通用Agent会让任务上下文变得驳杂,且难以定义任务完成的好坏,其商业模式最终容易走向成本导向。

但在垂类场景下,任务可以被明确定义,存在行业统一标准。创业公司的关键是,要切入信息生产场景,提供端到端的服务,而非单一工具。此外,应选择生产场景而非消费场景(如娱乐、社交),后者是大厂的必争之地,创业公司难以切入。

前百川智能合伙人、缘启智慧创始人兼CEO邓江:不是所有的场景,都愿意拥抱大厂

创业公司相较于大厂有两个优势。第一,技术上可以更垂直、更深入。大厂很难为某个细分领域投入如此聚焦的研发资源,它们做的是更普适、更广泛的技术。

“豆包”、蚂蚁等大厂推出健康类产品,我反而感到高兴。大公司的每个重大决策背后,一定有庞大的市场和数据支撑。反过来,每一种特定的病症,都意味着巨大的市场空间。 比如皮肤病,中国有上亿患者,把这个垂直领域做深做透,就足够一家公司立足了。

第二,创业公司可以保持技术独立性。不是所有的场景都愿意拥抱大厂,因为大厂可能与客户在某些领域存在深度竞争。 无论是出于数据安全,还是商业竞争的考虑,在任何行业、任何时代,独立的技术公司都有其生存空间。

攀峰智能CEO王铭:2026年是Agent“按效果付费”的元年

传统的SaaS工具模式,其经济模型是“收取的订阅费能否覆盖算力成本”,至于用户能否获得理想结果,工具方并不负责。我们认为,未来的经济模型应该转变为“获取的任务分成能否覆盖算力成本”,2026年会是按效果付费模式的元年。

这从根本上改变了产品的驱动力,迫使我们将更多精力投入到那些能直接帮助用户赚钱、离投资回报率(ROI)更近的功能打磨上。

这对资源有限的创业公司至关重要,因为大厂会逐渐向下寻找并占据优质场景。一旦验证了Agent能帮助用户低门槛赚钱,其传播速度会非常快,因为用户的决策成本几乎为零——先帮你赚到钱,你再付钱。

哪里去找钱:IPO是好事,但不要盲目

象征探索商业路径的迷宫插画
图源:AI生成

某一线美元基金合伙人:港股IPO是改善一级市场环境的契机

至少在过去,中国一级市场难以显著支撑长期、巨额且非净利润导向的研发投入。如果大模型企业不上市,未来在一级市场的融资效率肯定会很低,只能在现有估值基础上进行小幅度融资。

但港交所政策越友好、IPO的公司越多,优质科技型企业就有了更顺畅的退出渠道,并在资本市场获得国际投资者更公允的定价,这些都会反哺到一级市场。如果一级市场更活跃,中国的整体创新环境也会更好。

只有这样的循环被打通,一级市场才有可能真正支撑起千亿美元级别的科技公司,而不是让它们在早期阶段就不得不考虑上市。 作为对比,SpaceX等到估值近万亿美元时才考虑上市,其前期发展的资金全部来自美国一级市场。

绿洲资本创始合伙人张津剑:不要只做区域创新,要做让全球资本看见的全球创新

很多投资者认为,AI最终是中美的游戏。但美国有英伟达等诸多清晰标的,而中国的AI公司在世界上的面貌则不那么清晰。MiniMax的港股IPO为海外投资者提供了一个投资中国AI的清晰样本。

接下来每一家AI、具身智能公司的上市,都是中美之间“凿壁偷光”的一扇窗,让外界看到中国有众多企业在推动全球创新。从招股书上也能看到,它们的很多收入同样来自全球。

同时,越来越多的海外投资人也想直接投资中国。2025年夏天,美国很多GP(普通合伙人)到中国走访了一圈。归根结底,只要中国有创新、有服务全球的能力,资本自然会流入。

创业者应该坚定地去探索全球创新,而非区域创新。 未来中美之间有多少“墙”,就会有多少“洞”,比如港股IPO,比如2025年表现出色的DeepSeek和宇树科技,只要坚持创新,就一定有优质的资本主动找上门。

某模型初创公司融资负责人:走向二级市场是“双刃剑”

2026年初,月之暗面、阶跃星辰接连宣布新一轮大额融资。这件事向行业证明,一级市场依然有能力支撑大模型公司的发展

此前智谱AI、MiniMax的IPO向创业者释放的信号是,一级市场可能融不到钱了,所以大家匆忙走向二级市场。

但走向二级市场是一把“双刃剑”。好处是企业拥有了更顺畅的融资渠道和更大的市场声量。但也要意识到,企业很快会面临来自二级市场的商业化压力。

可以看到很多IPO后的企业,立刻开始大力布局ToB业务,因为ToB的优势在于变现速度较快。二级市场给企业的业绩兑现期通常只有一到两年,如果未能达到预期,股价会立刻下跌。

AI组织:“小”是趋势,“人效”是关键

象征团队协作与竞争的拔河插画
图源:AI生成

Honghub鸿鹄汇发起人邹凌:称职的极小团队创始人,需兼备机会洞察、执行力与自我营销

能把一人公司或极小团队良好运营起来的创始人,通常具备三种核心能力:

一,找机会的能力。 他们往往在某个行业深耕多年,能从自身经验中提炼真实痛点,找到可以用AI改进的低效环节。

二,快速执行力。 能借助AI工具独立在短时间内做出初版甚至多个Demo,然后迅速获取反馈,聚焦最有潜力的方向快速迭代。

三,AI时代,很多早期项目并不依赖传统的ToB销售或获客团队,个人创业者还要擅长用社交媒体为自己“代言”。 必须具备找到早期用户、验证需求,甚至直接带来初始现金流的能力。

清华交叉信息学院助理教授、AReaL项目负责人吴翼:极小组织形式与全栈创新能力相辅相成

极小的组织形式和全栈的创新能力是相辅相成的。 不仅是创业公司,大公司内部的AI研发团队也有必要做简化。因为人的沟通带宽有限,庞大的组织架构必然走向职责划分与管理,而人类低效的上下文共享能力会成为整个团队的效率瓶颈。

传统组织常把算法和基础设施(Infra)团队分开。如果做模型时过于强调这种分工,容易导致算法团队像甲方,Infra团队则承担做“脏活累活”的乙方角色

随之而来的问题是,做乙方的团队容易失去创新空间;而习惯于做甲方的团队,可能不愿意触碰底层细节,这会使他们失去对技术最底层的观察、感知以及创新所需的自驱力。

因此,在AI研发组织中,算法和Infra不宜彻底分离成两个团队。两者共同设计、协同演进,才能形成一支小而精悍、富有战斗力的团队。

DeepWisdom创始人兼CEO吴承霖:不要迷信一人公司,组织的关键在于“人效”

行业普遍认为AI能提升效率、替代人力。但当每家公司都拥有强大的AI工具时,相当于大家又站在了同一起跑线上。竞争的“内卷”程度只会上升,不会下降。

所以不要迷信一人公司的形式,最终评价组织的维度应该是“人效”。实际上,每家公司80%的成本是沟通成本,而非写代码或文档的成本。AI工具可以精确地规避这些沟通的隐形成本。

一些头部AI公司内部已经开始用AI来辅助任务分工。例如,系统能够识别员工的历史行为与技能体系,判定其舒适区,然后分配稍稍超出舒适区的任务,以促进成长。

目前,人类仍然需要作为AI的管理者。我们更需要的是技能全面、具有批判性思维的通才,来减少人与人之间的沟通问题。 我们公司内部为此成立了一个试验性组织“ROOT”,里面没有传统的岗位划分,每个人承担从产品策划到开发、管理的全栈工作,其效率是传统组织的好几倍。

基础模型下一战:让模型“看得懂”、“记得住”、“用得起”

象征精细调整AI模型的工程师插画
图源:AI生成

Luma AI首席科学家宋佳铭:多模态需要走向“大一统”

2026年,业界有必要在“大一统”路线上进行更多探索,即将图像、视频、音频、文本等模态的理解与生成能力融合在一个模型中。

相比于单一的图像或视频模型,大一统的扩散模型好处在于,具备更强的上下文学习(In-Context Learning)和零样本学习(Zero-shot)能力,天花板更高,落地想象空间也更大。

不少厂商选择将不同模态的模型拼接在一起,而非统一训练。这种方法能带来短期收益,但长期来看,可能会延误构建更强大、更统一模型的时间。

前百川智能联合创始人、来福电台创始人兼CEO焦可:AI时代真正的壁垒是“记忆”

2025年,行业对AI记忆的研究开始增多,但仍处于非常早期的阶段。人的记忆系统极其复杂,我们每天在睡眠中都会对短期与长期记忆进行合并、遗忘和抽象,相当于在进行一场持续的“日更训练”。目前还没有一套成熟的方案能系统性地做到这一点。

AI时代真正的壁垒就是记忆。 这是所有AI产品的兵家必争之地。我们之所以选择从语音交互切入,也是因为语音能让用户最自然地表达出长上下文(Long Context)。谁能与用户进行更多、更深的对话,谁才能获取用户更多的记忆,从而更懂用户,提供更个性化的服务。

因此,对我们而言,日活跃用户数(DAU)并没有那么重要,因为用户随时可能离开。我们更看重每日交流用户数(DTU),这代表每天有多少用户产生了新的记忆;以及长记忆用户数(LMU),这部分才是AI产品真正的价值所在。

前阿里/字节大模型负责人、Infix.ai创始人兼CEO杨红霞:“去中心化”推动落地

当前模型落地存在一个巨大鸿沟。许多高精尖领域、中小企业、医院、政府机构都想使用生成式人工智能,但迟迟无法实现,核心原因在于现有以个别厂商为中心的大模型缺乏它们各自领域的专有数据。

需要强调的是,模型知识的注入主要发生在预训练阶段。因此,模型在企业或机构的本地化部署,必须启动持续的预训练,因为医院、企业、机构拥有的大量本地化私有数据和知识,在公共互联网上是无法获取的。

同时,不同机构之间的数据难以共享,导致现有范式下模型无法做到真正的全球化与全行业化。

我相信未来每家公司都需要大模型这样一个“脚手架”。因此,我们希望把“脚手架”做得最便宜、最易用、门槛最低,让每一家企业或机构都能拥有本地化部署的专属模型。

第二件事,我们希望通过模型融合的方式,将某个领域的多个专业模型能力聚合起来,从而得到一个该领域更强的基础模型。例如,融合不同医院的专科模型,就能得到一个更强大的医疗领域基础模型。

所以,所谓的“去中心化”,就是在各个垂直领域,集合大家的能力,共同构建更优秀的领域大模型。关于更多 Transformer 架构模型与 AIGC 应用的深度讨论,欢迎访问 云栈社区 的人工智能板块进行交流。

具身智能与世界模型突破口:算法要创新,场景要验证

象征机器人工厂协同作业的未来场景插画
图源:AI生成

大晓机器人董事长、商汤科技联合创始人王晓刚:世界模型真要有效,必须有下游验证闭环

2024年11月,我就主导发布过智能驾驶世界模型,但当时行业对这项技术的态度是“不太信”。

原因是,包括英伟达Cosmos世界模型在内,当时不少公司把世界模型当作“数据生成器”。虽然可以在实验室生成大量看似合理的场景画面,但由于缺少下游真实场景的落地验证,无人能回答“这些生成的数据到底好不好用”,信任很难建立。

过去采集这类危险场景数据既昂贵又危险。而我们的方法,是先在商汤的世界模型里规模化生成大量场景画面与解决策略,再用上汽智己的实车对这些策略进行检验和校准,让模型能力在真实反馈中越练越准。

同样,世界模型在具身智能上的应用也需要下游场景验证。例如,大晓机器人选择先用硬件更成熟的四足机器人执行“上街巡逻”任务,在真实任务执行中验证并迭代世界模型的能力。

极佳视界创始人兼CEO黄冠:2-3年内可能迎来物理世界的“ChatGPT时刻”

真机应用的“视觉-语言-动作模型(VLA)+强化学习”正在快速迭代,但面临巨大的数据瓶颈。“世界模型”被认为是未来解决物理世界通用智能数据瓶颈的关键方式。

我认为,2-3年内将可能迎来物理世界的“ChatGPT时刻”。关于这个时刻的定义是:在100种常见任务中,能在90%的场景下达到95%的成功率。

之所以做出这个时间判断,是基于现有技术进展的速度。这个过程并非由世界模型单独完成所有任务,而是需要与VLA、强化学习互相配合。具体而言,VLA解决任务规划的复杂性,世界模型解决环境理解的泛化性,强化学习则提升动作执行的准确率和可靠性。

清华交叉信息学院助理教授、星海图联合创始人赵行:值得探索的前沿方向,是让机器人“预知未来”

我们会积极投入世界模型的探索,但它确实还未进入工业化的技术成熟阶段。

与依赖数据驱动的VLA不同,我认为世界模型是一个非常典型的、依靠“聪明算法”驱动的工作。它需要定义出最合理的算法,来建模物理世界的运动规律。

如果能把世界的动力学规律成功建模出来,那么我们就不再需要仅靠模仿学习的方式训练机器人了,机器人可以直接推理出每一个动作可能带来的后果。

但是,让机器人预知未来,可能比让它规划当前的动作更难,这有点像为了解决一个难题,必须先创造另一个难题。所以,它非常适合最聪明、最前沿的实验室去探索。




上一篇:十年前的“千问”公众号遭阿里五次投诉,30亿推广与商标维权引热议
下一篇:Javassist实战:动态生成恶意TemplateImpl类的字节码操作指南
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-9 01:47 , Processed in 0.395994 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表