
ElevenLabs不只是一家做音频模型的公司。
AI音频赛道,冲出一家百亿美元独角兽!
昨日,英国AI语音公司ElevenLabs宣布完成5亿美元(约合人民币34.7亿元)的D轮融资,其估值达到了110亿美元(约合人民币763.5亿元)。仅仅在过去一年,其估值就从年初的33亿美元飙升至如今的水平,实现了超过230%的增长。更值得注意的是,该公司联合创始人兼CEO Mati Staniszewski还透露,他们已在考虑进行IPO。
本轮融资由红杉资本领投。此前多次参投的a16z与ICONIQ分别追加了4倍和3倍的投资,显示出老股东们对ElevenLabs未来发展的高度信心。

ElevenLabs于2022年在英国伦敦成立,最初以开发高质量的文本转语音模型而闻名。随后,其业务版图逐步扩展至语音转文本、AI音效、AI配音及AI音乐等多个音频生成领域。
公司的商业模式也颇为立体:既为企业客户提供稳定的语音API服务,也为内容创作者和品牌方提供了一个名为ElevenCreative的音频生成平台。此外,他们还推出了面向企业级客户的AI语音客服解决方案平台ElevenAgents。其技术应用甚至延伸到了知名游戏《堡垒之夜》中。截至2025年底,ElevenLabs的年度经常性收入已经超过3.3亿美元。
成立不到四年,ElevenLabs已完成五轮融资,累计融资金额高达7.81亿美元。值得一提的是,英伟达曾参与其C轮融资。英伟达创始人黄仁勋曾公开称赞ElevenLabs打造了世界上最好的语音AI产品,并主动向内部团队推荐。如今,黄仁勋在各类大会中以虚拟形象亮相时,其声音正是由ElevenLabs的工具生成。

从融资规模、收入增速到背后的资本阵容,ElevenLabs已然稳坐全球AI音频赛道的头把交椅。一家如此年轻的公司,能在竞争白热化的语音AI领域迅速确立领先优势,显然不只是因为运气好。它背后的创业起点、关键的战略抉择,以及对产品与市场的深刻理解,值得我们深入探究。
上线6个月拿下百万用户,靠社交媒体实现爆发式增长
ElevenLabs的两位联合创始人Mati Staniszewski和Piotr Dabkowski都来自波兰。他们创业的初衷颇为有趣:童年时观看的那些配音质量低劣的美国电影,促使他们决定打造一款AI工具来解决这个问题。
在创业前,Mati Staniszewski曾在Opera、贝莱德以及Palantir等公司任职。而Piotr Dabkowski则是一名资深的谷歌软件工程师,直到2022年才与Mati一同投身创业。
初出茅庐的ElevenLabs能带来什么改变?早在2023年投资该公司时,a16z的投资人Bryan Kim就阐述了他的看法。他认为,尽管语音合成技术已存在数十年,但始终未能发挥其全部潜力。大多数合成语音缺乏吸引人的语调和个性,而高端的人工录音服务又因流程冗长、成本高昂,难以应用于大多数实时互动场景。ElevenLabs的出现,正是为了填补这一市场需求缺口。
2023年1月,ElevenLabs首次推出语音克隆产品,并显著提升了其文本转语音模型的质量。随后,公司不断迭代模型,扩展多语言支持,甚至获得了已故知名演员的声音版权,提供商业化的声音克隆服务。
这一系列动作取得了显著成效。产品上线仅六个月,ElevenLabs便积累了超过100万注册用户,生成的音频内容总时长超过10年。到2024年11月,其用户数已突破3300万。2025年,公司的年度经常性收入成功迈过1亿美元大关。
在2025年6月的一次采访中,ElevenLabs的增长负责人Luke Harries揭示了公司高速增长背后的两大驱动力。
一方面,公司的基础模型能力持续快速迭代,在语音的表现力和真实感上不断突破。ElevenLabs团队认为,与许多其他类型的AI模型不同,语音模型的优劣并非单纯由规模和数据量决定,模型架构的创新扮演着更为关键的角色。联合创始人Piotr Dabkowski利用其行业影响力,招募了多位世界顶尖的语音AI研究员,使公司在模型架构上取得了一些突破。当然,由于其模型是闭源的,外界很难详细了解这些改进的具体细节。

另一方面,ElevenLabs极其擅长市场营销。他们深谙如何利用社交媒体的力量,通过举办黑客松比赛、制作创意十足的演示视频等方式成功“破圈”,实现了爆发式增长。
而在拓展企业客户方面,ElevenLabs采用了“自下而上”的策略。即先从消费级用户和开发者社区切入,在建立起良好的口碑和信任度之后,大型企业客户便会自然而然地被吸引过来。
公司重心已成语音智能体,创始人竟不看好音频模型未来
然而,ElevenLabs的野心远不止于做一个优秀的音频模型提供商。在一次与TechCrunch的播客访谈中,Mati Staniszewski表示,他们真正想解决的根本问题,是人类如何与科技产品进行互动,这是指导他们所有产品开发的主线。
最初,他们通过文本转语音模型,让机器发出的声音更像真人。但Mati意识到,要创造真正卓越的交互体验,仅有逼真的声音是不够的。AI还需要能够生成各种声音和音乐,并具备理解语音内容的能力。他认为,这是公司从成立到2025年上半年间的核心工作重点。
但有趣的是,Mati Staniszewski本人对于“音频模型”这条赛道本身的长期前景并不十分看好。他直言:“这项技术或许在未来1-2年内仍具备竞争力,但再过几年,它很可能会完全商品化。”
在他看来,目前继续研发模型,是因为在短期内这仍是提升AI音频产品质量的最佳途径。可随着技术日益成熟、变得唾手可得,音频模型终将成为一种广泛可用的底层基础能力,而不再是企业的核心竞争优势。
基于这一判断,在2025年下半年,Mati带领ElevenLabs进行了一次至关重要的战略调整。如今,公司的首要任务转变为帮助企业部署能够真正理解上下文、进行自然对话的智能体,让企业能以全新的方式与用户和客户互动。
Mati认为,随着各类智能体,尤其是对话式和语音智能体的兴起,用户虽然可以与设备交谈,但要让这些智能体产生实际价值,关键在于将大量的企业信息与知识库集成到智能体内部,并使其能够与现有业务系统无缝连接。
集成之后,这些智能体产品还必须具备可测试、可评估、可监控的特性,如此才能赢得注重稳定性和可管理性的企业级客户的信任。
这些智能体的主要应用场景之一,便是AI语音客服。ElevenLabs的智能体是多模态的,可以理解口头或书面的输入,像人类一样倾听、阅读并与客户互动。企业还可以在ElevenLabs提供的可视化工具中对智能体进行深度定制,设计精确的对话流程,定义其与客户互动的每一个细节。

这一战略转向,让ElevenLabs在企业级市场加速扩张。如今,在语音智能体赛道上,其大客户名单中已包括思科、Meta、Salesforce等行业巨头。而在音频创作领域,迪士尼、Epic等影视与游戏公司也在使用其产品。
这一转变也直接体现在了财务数据上。在战略调整后,ElevenLabs的年度经常性收入增速明显加快。2025年初,公司花费20个月达到1亿美元ARR;而突破2亿美元ARR大关仅用了10个月。到了2026年初宣布实现3.3亿美元ARR时,距离达成2亿美元的目标仅仅过去了5个月。
主打AI模型与产品的结合,而非单纯堆砌算力与数据
语音AI赛道强手如林,无论是中国的MiniMax、阿里巴巴,还是海外的谷歌、OpenAI,都推出过优秀的语音产品。那么,ElevenLabs的差异化优势究竟在哪里?
Mati Staniszewski认为,正如软件与硬件的结合塑造了苹果的魔力,AI模型与卓越产品的结合才能释放最大价值。ElevenLabs虽然也会探索一些前沿方向,例如将开源视频模型与自家语音模型结合,但他们始终将重心放在打磨更好的产品体验上,而非像部分竞争对手那样,一味训练计算密集或数据密集的庞然大物。
同时,Mati强调ElevenLans具备更高的战略专注度。他们直接瞄准“改善人机语音交互”这一核心问题,其发展愿景在某种程度上独立于竞争对手的常规赛道。
获得新一轮巨额融资后,ElevenLabs的首要目标将是全力推动其智能体平台的发展。据悉,未来几天内,公司将推出适用于该平台的全新对话模型,旨在更快速、更准确地理解和表达情感。
目前,ElevenLabs已是一家拥有400名员工的“大公司”了(相对于其他同估值阶段的初创企业而言)。公司正在全球范围内积极扩张,已在伦敦、纽约、旧金山、华沙、东京、新加坡、悉尼等十多个城市设立办公室,并配备了本地化的市场与推广团队,这对于其语音AI业务在全球范围内的落地至关重要。
结语:以产品为导向,模型服务于场景
回顾ElevenLabs的成长路径,它并没有陷入堆参数、拼算力的传统模型军备竞赛,而是始终围绕一个更本质的问题推进:语音和音频技术,在真实世界中究竟如何被使用、能解决什么实际问题。而在战略层面,管理层又清醒地预判到“音频模型终将商品化”,果断将公司重心转向更具护城河价值的对话智能体与企业级解决方案。
这是一种典型的“产品先行,模型服务于产品”的策略。这让ElevenLabs在拥挤的语音AI赛道中构建了独特的差异化优势。或许,这正是头部企业和顶级风投愿意持续重仓押注ElevenLabs的关键所在。对于关注人工智能和AIGC商业化落地的开发者和技术决策者而言,ElevenLabs的案例提供了一个从技术突破到市场占位、再到战略升维的完整观察样本,值得在像云栈社区这样的技术交流平台中进行更深入的探讨。