找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

983

积分

0

好友

139

主题
发表于 4 天前 | 查看: 20| 回复: 0

图片

图片

时隔三年,竞争态势发生了大反转。

近期,OpenAI CEO山姆·奥特曼在内部宣布启动“红色代码”行动,推迟其他产品开发以全力应对来自谷歌等对手的冲击。而在三年前ChatGPT刚刚问世时,拉响红色警报的正是老牌人工智能巨头谷歌本身。

攻守之势的转换,清晰地映射出当前AI大模型竞争已进入一个新的周期。OpenAI此次拉响警报,源于其发现通过不断定义新战场所建立的领先优势,正逐渐被谷歌凭借深厚的场景与生态能力所侵蚀。

将时间线拉长来看,与OpenAI这类在算法层面先声夺人的公司相比,谷歌所拥有的场景和生态能力在当前的拉锯战中开始占据主动。场景与数据同大模型结合后产生的“飞轮效应”,其威力超出了许多人的预期。

在国内市场,类似的剧情也在同步上演。例如,可灵(Kling)凭借快手在移动应用时代沉淀的海量视频数据和用户场景,快速从视频生成赛道中脱颖而出;而快手庞大的应用生态又为可灵提供了模型迭代和商业闭环所需的关键场景与反馈。这都表明,上一个时代积累的APP场景与数据,在AI时代依然关乎大模型能力闭环的构建。

无论是国内外的AI原生玩家,还是科技巨头,都在加速基于自身场景,构建从数据、模型到应用落地的完整闭环。在这场竞争中,谁能更有效地将“场景理解”转化为“智能理解”,谁就有望定义AI战争的下一章。

01 红色警报背后:新王与旧王的攻防战

硅谷的红色警报再次响起,但主角已然互换。

今年8月,谷歌推出的轻量级模型Nano Banana以其出色的表现,强力驱动了Gemini用户规模的快速增长。到了9月,Gemini成功登顶美国及其他多国AppStore免费榜。11月,谷歌官方博客披露,Gemini的月活跃用户已突破6.5亿,大幅缩小了与ChatGPT约8亿月活的差距。

人工智能先驱杰弗里·辛顿(Geoffrey Hinton)近期在接受采访时明确表达了对这场竞争的看法,他甚至对谷歌“直到现在才翻身”感到惊讶。他认为,谷歌拥有自研芯片、顶尖研究员、海量数据沉淀和庞大的数据中心,这些综合优势将助其赢得战争。

有行业分析指出,场景和数据优势在当下的智能竞争中至关重要。谷歌在搜索等核心业务中沉淀了海量的用户意图与行为反馈数据(例如用户点击哪个搜索结果),这种“决策-结果-反馈”的闭环天然适配强化学习从人类反馈(RLHF/RLAIF)技术。在Scaling Law(缩放定律)越来越重视后训练阶段的今天,这类高质量反馈数据对提升模型智能至关重要。

可以说,AI战争已不再是单一模型参数规模的比拼。应用时代积累的生态与分发优势、技术与数据的闭环、产品间的协同与场景落地能力,都成为了影响战局的关键变量。

无独有偶,在国内战场,相似的情形正在发生。无论是阿里通义千问试图协同高德、饿了么等生态力量打造“会办事”的AI入口,还是字节跳动豆包手机通过AI Agent奇袭传统APP引发超级应用们的反应,都显示出AI时代的硝烟与上一个移动互联网时代的战局紧密相连。

事实上,在视频生成领域,类似的剧本去年就已上演。

2023年2月,OpenAI的Sora演示视频震惊业界,成为赛道的定义者。然而,去年6月才加入赛道的快手旗下可灵(Kling),却凭借可立即试用的分钟级视频生成能力,在节奏上超越了当时的“定义者”。快手在财报中透露,可灵AI单季度收入已突破2.5亿元。

相比之下,OpenAI的Sora 1直到去年12月才上线,Sora 2于今年9月底发布。虽然技术备受称赞,但其从“惊艳的玩具”转变为“实用的工具”面临挑战。有数据显示,Sora的用户留存率并不理想。

这清晰地展现了拥有场景和应用生态在AI时代的巨大价值。快手并非传统的AI第一梯队玩家,但其基于APP时代沉淀的海量场景与数据,沿着Sora开拓的路径,成功打造了一款具有全球影响力的产品。

02 空间智能:呼唤属于自己的“数据飞轮”

作为人工智能演进的前沿方向,空间智能领域同样在复现上述逻辑——场景、数据与智能能否形成迭代闭环,直接关系到该技术能否从实验室加速走向规模化产业落地。

行业分析认为,当前整个空间智能领域可类比于大语言模型的GPT-2阶段:技术路线仍在激烈碰撞,基础能力持续积累,行业的“缩放定律”尚未明晰。全行业亟需破解高质量、大规模3D数据稀缺的瓶颈,基于真实场景加速“数据-模型”的迭代循环,才能推动空间智能的“涌现”。

直白地说,整个行业都在呼唤构建起空间智能自己的“数据飞轮”。

目前,行业内玩家正从不同层面推进。例如,李飞飞的Marble、Google DeepMind的Genie 3、Meta的SAM 3D、腾讯混元3D以及英伟达的Cosmos等模型,都在探索空间的重建、生成、推理与交互。但作为一个早期领域,这些分散的能力很少能在一个体系内被广泛应用,这无疑不利于行业级数据飞轮的形成。

国内最早从事物理世界模拟的公司之一——群核科技,做出了一个关键决策:将其14年来沉淀的底层空间能力,通过Aholo空间智能开放平台全面向行业开放。该平台以API/SDK形式,逐步开放模型层和工具层的四大核心能力:

  1. 空间重建:基于3D Gaussian Splatting(3DGS)等技术,快速1:1复制物理世界到数字世界。
  2. 空间生成:从文本或图片描述中,从零开始生成高质量的三维场景。
  3. 空间编辑:解决AIGC内容“黑箱”、难以二次调整的痛点,让AI生成的内容可控、可改。
  4. 空间理解:为机器人、具身智能等提供看懂并理解物理世界的基础能力。

这四重能力集中开放,有助于行业加速应用落地,构建基于场景反馈的迭代闭环。例如,3DGS重建与空间生成能力结合,打破了高质量3D数据的生产瓶颈;而空间编辑工具则如同语言模型的多轮对话,能让专业人士深度校准和优化生成内容,产出更符合需求的物料。

“市场才刚刚开始,谈不上竞争。行业当下最需要的是底层技术的‘卖水人’,我们希望空间智能能够更快向前。”群核科技董事长黄晓煌表示。随着算力提升,从空间设计、影视制作到工业数字孪生,市场对高质量、可交互3D数据的需求正在急剧攀升。

03 从公司飞轮到产业飞轮

对群核科技自身而言,开放的过程也是其“数据飞轮”加速的过程。

这家从云设计软件起家的公司,已拥有全球最大、最多元的物理正确的空间场景数据库。这些符合物理规律的数据,成为了训练强大空间智能模型的优质燃料。今年,群核推出了业界首个专注于3D室内场景的认知与生成大模型。

如今,通过Aholo平台将数据、大模型与工具能力全链路开放,群核有望吸引更丰富、多维的场景和数据反馈,从而进一步加速其模型与工具的迭代,形成一个更强大的正向循环。目前,其已与合作伙伴在工厂数字孪生、仿真等场景中测试基于完整工作流的应用,以降低实体改造中的试错成本。

另一方面,全面开放也标志着群核从3D软件提供商向空间智能基础服务提供商的转变。黄晓煌认为,空间智能正处于发展早期,通过开放平台与行业共同解决问题、突破瓶颈,是顺势而为。

“今年以来,包括DeepSeek在内的一批公司都选择将底层能力开放,大家有一种一起推动行业往前走的势头。”黄晓煌说。这种开放共享的姿态,或许也是当下中国创新企业进入新阶段的缩影:既能参与最前沿的创新竞争,也具备成为行业基础设施的意愿与能力。

从群核和快手的例子可以看出,中国企业在移动互联网时代积累的丰富场景与海量数据,正在成为推动AI发展的关键燃料,并助力企业在新的智能赛道上构建起自己的“飞轮”。

中国整体的应用与数据优势,能否加速推动整个中国AI产业构建起“场景-数据-智能”的宏大飞轮,实现从场景优势到智能优势的跃迁?这或许是当下中国AI发展面临的核心命题之一。




上一篇:商务邮件入侵(BEC)防御实战:从发票篡改案例看企业邮箱安全加固
下一篇:Agentic AI基金会成立:MCP协议与AGENTS.md驱动下一代AI智能体标准化
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-17 17:29 , Processed in 0.108103 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表