找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2097

积分

0

好友

301

主题
发表于 2025-12-31 03:00:34 | 查看: 24| 回复: 0

“95%的AI项目失败了,这很正常。”
“我其实希望明年还会看到类似的数字。”

大模型的发展已近四年,对于2026年,除了技术路径,业界最关心的问题依然是:AI到底有没有泡沫?近日,Databricks联合创始人兼CEO Ali Ghodsi在一次圆桌讨论中给出了肯定的回答。他认为泡沫确实存在,但并非所有人都身处其中。

他将当下的AI领域划分为三大阵营:“我会说,确实有泡沫,但要分几类。第一类是‘超级智能追求派’,这一派我会非常担心。第二类是做基础研究的研究人员,这一类并不在泡沫里,他们非常清醒、理性,只是几乎没人关注他们。可惜的是,往往他们才是对的。第三类就是我们——尝试把AI变成真正有价值的东西。从这个意义上说,我们并不在泡沫里,因为我们并没有在这件事上烧掉巨额资本,我们只是试图在组织内部创造真实的经济价值。”

三位嘉宾在圆桌讨论中交谈
图:Databricks CEO Ali Ghodsi(中)与Glean CEO Arvind Jain(右)参与圆桌讨论

对于MIT报告中“95%的AI项目都失败”的说法,另一位嘉宾、企业搜索与AI工作平台Glean的创始人Arvind Jain表示这并未引起他的担忧。“我甚至希望明年还能看到类似的失败率,因为我们希望整个行业都保持高度的实验意愿,真正去摸索如何从这项技术中获得价值。”

Ali一手将Databricks从Apache Spark背后的团队,发展成为企业数据与AI平台的核心。Arvind则有深厚的工程背景,曾负责谷歌搜索、地图等重要产品研发,并联合创办了已上市的云数据管理公司Rubrik。2019年,他创立了Glean。两位CEO分享了关于企业AI落地、工程化路径以及行业趋势的诸多高价值见解,例如:

  • 大模型正在快速商品化,真正的护城河是“你手里的数据与业务流程”。
  • 企业AI的挑战不是技术本身,而是组织、治理和工程实现。
  • AGI已经实现,我们不需要等待超级智能。
  • 未来五年,更大的价值会流向“智能层”,并最终沉淀在“应用层”。

他们还给出了实用的建议,例如建议企业将预算分配给不同的模型和智能体厂商,并签订短期合同,因为大模型的迭代速度超乎想象。Ali特别看好语音交互智能体的方向,他认为数据输入的范式将发生变革,键盘最终会消失。此外,对于“软件已死”、“软件会不会退化成数据库”的争议,两人都持否定态度。

95%的AI项目失败了,这很正常

主持人:今天想聊聊AI的真实现状。我们看到消费级AI已有数十亿用户,但在企业端却非常割裂。一边是模型在各种基准测试上不断刷新成绩,另一边却是MIT报告指出95%的AI部署项目都失败了。现实到底是什么样?

Arvind:首先,人们在个人生活和工作中都已经在使用AI了,并没有那么明确的“割裂”。至于企业里“95%项目失败”,这正是你在尝试新技术时希望看到的情况。如果你所有项目都成功,那反而说明你尝试得不够激进。所以当我看到这份研究时,并不意外。我甚至希望明年还能看到类似的数据,因为我们希望整个行业都保持高度的实验意愿,真正去摸索如何从这项技术中获得价值。

Arvind Jain在讨论中发言
图:Glean CEO Arvind Jain表示对高失败率并不意外

主持人:那从统计上看,你们就属于那“5%真正跑通的AI”。有没有那种可以给CFO看、能体现在财务结果上的成功用例?

Ali:我们看到了不少成功用例,但关键在于:你不能指望把一堆智能体放出来,它就自动跑起来。这本质上是一门工程艺术。 这些系统需要评估、产品化、时间和投入,需要一支非常强的团队。

比如加拿大皇家银行(RBC),他们构建了一套智能体系统,能在财报发布后快速抓取并分析信息,自动生成股票研究报告。过去行业标准是两小时,现在15分钟就能完成。

在医疗健康领域,默克(Merck)构建了一个叫Teddy的Transformer模型,用于预测基因调控网络,这对药物发现意义重大。

在零售行业,7-Eleven用智能体几乎自动化了整个营销技术栈,可以实现高度定制化的用户分群和内容投放。

金融、医疗、零售行业的AI成功案例示意图
图:AI在金融、医疗、零售等行业的价值转化案例

LLM已经是商品了,数据才是真正的护城河

主持人:这些成功案例的共同点是什么?

Ali我认为大语言模型已经是商品了。很多人不愿意承认,但它就是商品。商品是可互换的,就像汽油。LLM现在就是这样:这一周这个模型更强,下周可能换另一个。所以重点根本不在模型本身。

真正重要的是你的公司掌握了什么独特的数据。世界上没有任何一个AI天生就懂你公司的业务流程和核心数据。那才是关键所在,也正是那95%的难点。如果AI能够介入并重塑你公司独有的复杂业务流程,你就能领先。不幸的是,很多公司做的只是“商品化能力”,这对你并不特别。这正是行业里的核心问题。

Ali Ghodsi阐述观点
图:Ali Ghodsi认为LLM正在变为商品

另一个问题是“Demo Ware”——演示型产品。用生成式AI做出一个很酷的Demo太容易了,所以我们看到大量看起来很炫的Demo,但也就止步于此。

圆桌讨论现场,嘉宾讨论Demo陷阱
图:嘉宾指出许多AI演示仅停留在酷炫阶段

主持人:能不能分享一个你们做过的、属于那95%的失败案例?

Arvind:现在做工程有一个很有意思的变化:你今天刚有一个很棒的想法,两周后它可能就不再是个好主意了,因为技术又出现了新进展。

我们曾经在产品里针对特定用例做过模型微调,最后发现效果并不好。最终我们选择放弃,转而使用已经成熟的模型。从公司内部应用来看,很多事情比预期花费了更长时间才能产生真正的价值。

AI只是工具箱里的又一个工具,它并不会让构建复杂的企业系统突然变成“一天就能搞定”的事情。上一次企业对某种工具如此兴奋,还是RPA。

Arvind Jain谈论AI作为工具
图:Arvind Jain认为AI是工具箱中的新工具

主持人:这次AI浪潮和RPA有什么本质区别?

Arvind:我完全不认为这两种技术有可比性。我们现在看到的AI是非常基础性、根本性的变化。第一次看到它的时候,感觉几乎像魔法一样——我们不敢相信这是机器在完成这些事情。机器竟然能写作、能理解情绪,这在过去是不可想象的。

Arvind Jain表达对AI能力的惊叹
图:Arvind Jain谈及初识AI时的震撼

正因为如此,我不认为这项技术会像RPA那样逐渐消失。我们每个人都能感受到它的能力,它很特别,而且会长期存在。

Ali:RPA本质上是基于规则的,系统非常脆弱、很难维护,它从来不学习。而现在的系统是会学习的,可以不断改进、泛化、理解模式。这是最根本的差异。

确实有不少创业公司尝试用生成式AI去替代RPA,结果失败了。原因在于,今天的AI范式本身还有问题:模型被训练出来后是“冻结”的。我们真正需要的是一种能够在交互过程中持续学习的AI。方向是对的,但我们还没有真正把“计算机使用”这件事完全搞定。

Ali Ghodsi分析RPA与AI的区别
图:Ali Ghodsi指出当前AI范式仍是“冻结”的

建议多尝试不同厂商,签短期合同

主持人:对于正在规划AI预算的CIO,你们有什么建议?

Arvind:现在的AI市场非常早期,玩家众多。真正的赢家还没有出现。所以我们的建议是:多尝试不同的厂商,签更短周期的合同。 当然,还要选那些容易测试的产品,而不是那种需要六个月集成才知道结果的方案。真正用对了AI的产品,应该能非常快地产生效果。先爬,再走,再跑。

早期AI市场建议图示
图:对早期AI市场的建议:广泛实验、短期合同、快速测试

万亿美元AI收入市场,如何演进?

主持人:现在有大量资本投入AI基础设施,为了证明其合理性,市场需要创造约1万亿美元的AI收入。而整个软件行业的年收入才约4000亿美元。这件事会如何演化?

Arvind:我是工程师,不太纠结谁在花多少钱。但更本质地看,AI并不是在边际上“增强”软件,它本身是一种完全不同的产品。事实上,它会吸走大量原本存在于服务行业的收入,而服务行业的规模大概是软件行业的25倍。 所以你现在看到的AI投入,很大一部分其实是服务支出在向AI、向软件转移。

Arvind Jain谈论AI对服务业收入的转移
图:Arvind Jain认为AI正在吸收服务业支出

AI领域已经分成了三大阵营,“我们并不需要超级智能!”

Ali:整个AI领域可以分成三种范式。我会把Arvind放在第三类,我自己也在第三类。

第一类,是“追求超级智能”的阵营。 几乎所有前沿实验室都在做这件事。他们的逻辑是:谁拥有最多的GPU、最多的数据,谁就能赢得超级智能竞赛。他们追求的是一种近乎“神级”的智能,能够实现递归式自我改进,治愈癌症,在几年内把GDP提高十倍。他们的路径很明确:更大的计算集群、更多的能源投入。这也是目前大部分资本流向的地方。

Ali Ghodsi描述第一阵营的目标
图:Ali Ghodsi描述“超级智能”阵营的宏大目标

第二个阵营,是最初发明这项技术的科学家。 比如提出强化学习的Rich Sutton,深度学习奠基者Yann LeCun等。他们的观点非常一致:第一种路径根本不是正确方向。现在的方法只是自回归的“下一个token预测”,而人类和动物并不是这样学习的。他们认为真正的突破还要20年。

Ali Ghodsi引用研究者的观点
图:Ali引述研究者认为当前方向“甚至都不是正确的方法”

第三个阵营,也就是我们所处的阵营,认为:我们并不需要超级智能。 我不认为我们现在就需要那种级别的智能。在我看来,我们已经拥有AGI了。我2009年在UC Berkeley的AI实验室时,我们对AGI的定义,早就已经被满足了。现在你随便用一个LLM,它的推理能力已经超过不少人了。我们现在纠结的只是“它到底有多聪明”,而不是“它是不是通用智能”。

既然我们已经有了AGI,那接下来的问题就很明确:如何让它在企业内部真正产生价值?如何把那5%的成功率,扩大到10%、20%、30%?我们已经拥有所需的AI,接下来只需要专注解决组织内部的真实问题,自动化大量工作,创造经济价值。我们并不需要等超级智能。

AI研究的三种路径示意图
图:AI研究的三种路径:超级智能探索、清醒研究者、实用AGI

Ali Ghodsi阐述第三阵营的工作
图:Ali认为第三阵营应专注于利用现有AI创造价值

未来5年,更多价值会流向智能层,但最终沉淀在应用层

主持人:如果把AI栈分为数据层、智能层、应用层,你认为未来五年里,价值主要会沉淀在哪里?

Arvind:模型本身会对所有人开放,会变成商品。因此,很难想象大部分新增支出会长期集中在模型层。我倾向于认为,会有一部分预算明显流向智能层,而且这个层会变得非常“厚”。

Ali:LLM本身会商品化,但这并不意味着那些公司没有价值,它们就像“代工厂”:重要、昂贵,但可替换。真正前所未见的是,人们可以在一天之内随意切换LLM。所以真正特殊的,是你拥有的数据。如果你的公司拥有一些竞争对手没有的数据,那才是护城河。

同时,治理和安全这一层会变得极其重要。如果有一堆代理在系统里跑,怎么把权限锁住?怎么做治理?这些都是大问题。

但我依然认为,大部分价值最终会沉淀在应用层。这其实符合直觉。只是我还不知道,究竟会是哪一些应用。我个人非常看好像Glean这样的“应用型平台”。因为它有潜力大幅度减少组织内部的协作成本。组织运转本质上是一个n²的问题,每个人都要和很多人沟通。这些过程里有大量可以被AI自动化、提升效率的空间。

Arvind Jain讨论价值流向
图:Arvind认为支出将更多流向智能层而非顶层

圆桌讨论现场,嘉宾讨论技术选型
图:嘉宾以Google Sheets和Excel为例说明技术粘性

数据作为护城河的示意图
图:示意图强调数据是企业的真正护城河,而LLM正在商品化

Ali Ghodsi认为价值将归于应用
图:Ali Ghodsi判断大部分价值将归于应用程序层

这让我想起2000年左右,大家都在问互联网的杀手级应用是什么。后来跑出来的是Facebook、Airbnb、Uber这些公司。未来的AI世界里,哪些会成为这样的公司?我不知道。但它们一定会出现,而且会非常值钱。这不是一个非此即彼的结果,会有新的巨大价值被创造出来。

互联网与AI时代价值层级对比图
图:对比互联网与AI时代各层级(应用、平台、基础设施)的价值分布

软件已死?会退化成数据库?

主持人:现在也有很多人说“软件已死”,未来软件层会不会退化成一个数据库?

Arvind:我觉得这种说法过于简化了。比如把Salesforce说成只是一个数据库,这并不准确。它实际上是一个完整的生态系统。我一直不太理解那种认为未来会出现一个统一企业数据库,用AI动态生成一切的观点。我并不认为事情会这样发生。

确实,AI让构建变得更容易。但现实是,大多数时候你并不知道自己真正想要什么。优秀的软件公司真正的价值在于,它们会思考:如何把数据呈现出来,如何让人类以一种自然的方式去交互、去修改数据,并在这个过程中释放出更高的生产力。

所以我最终的看法是:软件本身是一个端到端的完整技术栈。在我看来,这些公司不会消失,也不会被“降级”为单纯的数据库。

Arvind Jain反驳“软件退化”论
图:Arvind Jain不认为软件会被降级为数据库

Ali:我认为语音交互替代键盘这件事会在未来几年内发生。就连Glean也是一样——你不会再想打字,你会想直接跟它说话。

真正的大问题在于:数据是如何进入数据库的。 而在今天,这一步还远远谈不上完全自动化。如果要说哪家公司在“数据输入”这件事上位置最好,其实可能是Zoom。很多人不会这样看它,但Zoom本质上非常适合作为“数据入口型应用”。如果它能把这些对话中最重要的信息提取出来,作为“系统级记录”,那将是对整个SaaS体系的彻底颠覆。

Arvind:而事实上,这类事情已经在发生了。现在最常见的一类智能体就是:拿会议录音 → 识别谈了什么 → 找出行动项 → 自动更新到CRM系统里。这些已经不是未来式了。

CEO是如何用AI推动公司发展的?

主持人:你们作为CEO,在AI时代是怎么工作的?如何推动大型组织真正用起来、产生收益?

Ali:我们内部已经在用各种各样的智能体。比如,有一类智能体非常擅长“理解客户”。我们有一个叫 Ref 的智能体。如果我想了解某个客户、某个行业、某个最佳案例,我直接问它就行。在Go-To-Market和营销线上,很多准备工作已经被彻底自动化了。

Databricks内部智能体应用场景图
图:Databricks在不同部门(销售、财务、HR、工程)应用智能体的场景

工程是另一条大线,这里面有很多经验教训。我们最初尝试大规模自动化软件工程,其实失败过。问题不在AI,而在人,在组织方式。

比如财务。现在我们所有财务系统都跑在Databricks上,预测和分析基本都转向了机器学习。但这花了很长时间。因为他们原来有一堆Excel模型,而且非常自豪,不愿意放手。最后我们请了外部数据科学团队先把模型建好,等内部团队熟悉之后,财务部门才慢慢接手。现在,Databricks的财务团队已经基本从Excel迁移到了Python。类似的事情也正在HR等部门发生。

Arvind:我分享一个个人用得最多的智能体:Daily Prep Agent。每天早上,它会告诉我今天有哪些会议、需要读什么、需要为哪些会议做准备。很多会议我原本是没有上下文的,它会把背景直接补齐。

另一个变化,是我刻意改变了自己的“本能反应”。当你是CEO,提一个问题,往往会立刻牵动30个人。现在我的本能变成了:有好奇心 → 先问AI;要做分析 → 用AI;要写每月给全公司的信 → 先用AI辅助。

我觉得最关键的一点是:你必须真正相信,AI是一个协作伙伴。 它不会替你完成工作。但如果你持续使用,它会让你的输出质量变得更好。哪怕在最初几个月你并没有节省时间,但最终,你会写得更好、想得更清楚、做出更高质量的决策。

Arvind Jain谈论将AI视为合作伙伴
图:Arvind Jain强调必须相信AI是优秀的合作伙伴

快速问答:赢家、泡沫与趋势

主持人:12个月后,OpenAI、Anthropic这些公司的前景是涨还是跌?

Ali & Arvind:涨。(两人均表示看好)

关于OpenAI和Anthropic的快速问答图示
图:快速问答环节,两人均看好OpenAI和Anthropic前景

主持人:AI有没有泡沫?

Ali:有AI泡沫。但我会把它分成三类。第一类“超级智能追逐派”存在泡沫,我会非常担心。第二类做基础研究的研究者不在泡沫里。第三类是我们这类创造实际经济价值的公司,我们并没有投入非理性的资本。所以泡沫是存在的,但不是单一形态。

Arvind:我同意。确实有不少公司存在明显的过度乐观,估值远远领先于真实业务基础。相比非AI公司,AI公司的估值倍数确实更高,但这背后也有原因,因为它们的增长速度确实会显著快于非AI公司。

AI是否存在泡沫的讨论图示
图:讨论AI是否存在泡沫,结论是泡沫存在于特定阵营

主持人:如果做多/做空一个趋势,你们的选择是?

Ali:我非常看好智能体和语音作为主要交互方式。我认为键盘最终会基本消失。我们还没有真正“搞定”语音交互,一旦键盘被彻底替代,那才算真正完成。至于“做空”的部分,我会说编码和客户服务自动化这两件事被稍微高估了。

三位嘉宾讨论看多/看空的趋势
图:嘉宾分享他们看多(如语音、智能体)和看空(如客服自动化)的领域

Arvind:我最看好的,是那些会改变“产品与用户关系范式”的产品。过去是你做一个产品,期待用户来找你;但未来,如果你能极其深入地理解你的用户,并且把AI主动带到他们面前,这一类主动型AI产品是我最感兴趣的方向。真正做到这一点,才能把AI从“只有5%的用户是重度用户”,带到“几乎100%的人都在用”。


以上观点整理自Databricks CEO Ali Ghodsi与Glean CEO Arvind Jain的圆桌对话,为关注人工智能企业智能化转型的从业者提供了宝贵的行业洞察与实践思考。更多深度技术讨论,欢迎访问云栈社区




上一篇:微软工程师提出愿景:2030年将C/C++代码替换为Rust,AI辅助重写
下一篇:英伟达测试评估Intel 18A工艺,未选择英特尔代工服务
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-11 11:55 , Processed in 0.362499 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表