找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

948

积分

0

好友

116

主题
发表于 昨天 05:20 | 查看: 2| 回复: 0

未来科技感的数据分析概念插画

借AI东风,一家开源数据库初创公司在短短7个月内估值增长2.5倍,一举冲上 150亿美元(约合人民币1045亿元) 的惊人高度。

2026年初,美国开源数据库公司ClickHouse宣布完成 4亿美元(约合人民币27.9亿元) 的新一轮融资,使其估值迈入千亿人民币俱乐部。在AI数据分析的赛道上,ClickHouse被视为Databricks和Snowflake的有力竞争者。自2021年正式成立以来,该公司已完成4轮融资,累计融资金额突破 10.5亿美元(约合人民币73.1亿元)

这家公司的吸引力不仅限于资本市场。其开源项目在GitHub上已获得超过4.5万个Star,并凭借强悍的性能赢得了全球众多明星客户的信任,客户名单包括字节跳动、腾讯、阿里巴巴、Meta、微软、特斯拉、索尼等国内外科技巨头。更有OpenAI和Anthropic的高管公开表示,ClickHouse 对GPT-4o和Claude 4的发布功不可没

从官方对比数据来看,ClickHouse展现出显著优势。例如,与当前热门的Snowflake相比,ClickHouse的成本仅为前者的 1/4,查询速度是其 3~5倍,数据压缩率还能再提升 38%

ClickHouse GitHub仓库主页,星标数达45.3k

ClickHouse的故事可以追溯到28年前成立的俄罗斯互联网巨头Yandex。其创始人阿列克谢·米洛维多夫(Alexey Milovidov)于2009年在Yandex内部启动了一个实验项目,并在2012年将该数据库应用于Yandex自家的Metrica网络分析平台。2021年,米洛维多夫与前Salesforce高管亚伦·卡茨(Aaron Katz)、前谷歌工程副总裁尤里·伊兹拉伊列夫斯基(Yury Izrailevsky)联手,将ClickHouse正式从Yandex剥离,成为一家独立公司。

ClickHouse三位联合创始人合影
从左至右:尤里·伊兹拉伊列夫斯基(Yury Izrailevsky)、亚伦·卡茨(Aaron Katz)、亚历克谢·米尔沃伊多夫(Alexey Milovidov)

值得注意的是,本轮融资的领投方Dragoneer,此前已投资了Datadog、Snowflake和Databricks等ClickHouse的竞争对手。Dragoneer的私募投资联席主管克里斯蒂安·詹森(Christian Jensen)在对比了各家产品后认为,ClickHouse目前拥有最佳的“实时分析”能力

这家成立仅4年就一边融资一边收割大客户的数据库公司,究竟强在哪里?我们通过梳理其发展历程、技术架构与应用场景,试图找到答案。

4年拿下超70亿融资,ARR同比增长超250%

ClickHouse的起源可以追溯到2009年。其创始人兼CTO阿列克谢·米洛维多夫在2008年加入俄罗斯最大搜索引擎公司Yandex,次年便与团队启动了旨在从非聚合数据中实时生成分析报告的实验项目,这成为了ClickHouse的雏形。

2012年,这个数据库正式上线,但最初仅服务于Yandex内部的Metrica网络分析平台(当时全球第二大网络分析平台)。直到2016年,ClickHouse才对外开源,并于2021年独立运营。

这款数据库的核心优势在于,它能够高效地摄取存储在数据库内的数百PB数据,并对这些数据进行各种复杂的分析查询,同时以毫秒级延迟返回结果。独立运营后,ClickHouse迅速成为资本和市场的宠儿。

2021年,刚成为独立公司的ClickHouse连续宣布完成两轮共计3亿美元融资,估值跃升至20亿美元(约合人民币139亿元),跻身独角兽行列。同年8月,其获得5000万美元A轮融资,两个月后又完成了由Benchmark和Yandex参投的2.5亿美元(约合人民币17亿元) B轮融资。

从2025年6月至今的半年多时间里,ClickHouse再获两笔巨额融资。在2025年6月的首届用户大会OpenHouse上,它宣布获得3.5亿美元(约合人民币24亿元) C轮融资;2026年1月17日,又宣布获得4亿美元新融资。至此,其估值已飙升至150亿美元。

在商业化方面,ClickHouse通过销售全托管云服务ClickHouse Cloud实现盈利。CEO卡茨透露,公司年化收入已达数亿美元,2025年的年度经常性收入(ARR)同比增长超过250%

查询速度可达MySQL的260倍,毫秒级响应背后的架构

过硬的产品实力是ClickHouse安身立命的根本。要理解它的价值,需要先了解数据库领域的两种核心架构:OLTP(联机事务处理)和OLAP(联机分析处理)

简单来说,OLTP数据库(如MySQL)采用行式存储,擅长处理高频、短小的交易事务;而OLAP数据库(如ClickHouse)采用列式存储,专为高效的数据分析和复杂查询而设计。在当今企业亟需实时决策支持的环境下,能够提供实时查询分析能力的OLAP数据库展现出更大的潜力。

过去,使用传统的行式OLTP数据库处理分析查询,可能需要几分钟甚至几小时。而现代OLAP数据库可以在毫秒内获得答案。根据分析机构Marko Medojevic的报告,在分析一个包含1100万条记录的数据集时,ClickHouse的查询速度比MySQL快约260倍,这直观地展现了OLAP架构在处理海量数据分析时的优势。

具体而言,ClickHouse是一个使用列式存储的开源OLAP数据库,其目标是快速执行分析查询,同时处理数万亿行和PB级别的数据。

ClickHouse数据库引擎总体架构图
ClickHouse数据库引擎的总体架构

根据官网数据,ClickHouse在成本与性能的平衡上表现突出。与Snowflake的对比显示,其成本仅为后者的1/4,查询速度却提升了3~5倍。

ClickHouse与主流数据库系统性能对比图表
ClickHouse与主流数据库系统性能对比(数据来源:ClickHouse官网)

面对企业级应用中海量多源数据整合与实时复杂分析的挑战,ClickHouse通过一系列关键特性来提升综合处理能力:支持极高的数据摄取速率、适配高并发低延迟的查询场景、具备高度开放性以兼容多样化的数据存储系统和格式、配备强大易用的查询语言,并能在从笔记本到高性能服务器的各类硬件上灵活运行。

值得一提的是,卡茨曾指出ClickHouse的一个核心差异:多数开源数据库工具基于Java开发,而ClickHouse采用C++编写,这使其在处理大规模数据时能获得更高的原生性能。

顶级客户云集,成GPT-4o、Claude 4背后的关键基建

尽管其开源项目免费,但ClickHouse以此为基础构建了庞大的商业版图。其全托管服务ClickHouse Cloud已拥有全球超过3000家客户。

这份客户名单堪称豪华,囊括了国内外科技巨头及垂直领域的顶尖公司:字节跳动、阿里巴巴、腾讯等国内互联网大厂;微软、特斯拉、Meta、索尼、网飞等海外巨头;以及OpenAI、Anthropic、Cursor、Character.ai等当红的AI初创企业。

在国内,腾讯云基于ClickHouse构建了腾讯云数据仓库TCHouse-C,帮助企业在几分钟内快速搭建PB级实时数据仓库。字节跳动研发团队则基于ClickHouse开发了ByteHouse。微信也使用ClickHouse存储日志数据,利用其高压缩率特性,显著减少了日志占用的存储空间。

在炙手可热的生成式AI领域,ClickHouse更是成为了Anthropic的Claude 4和OpenAI的GPT-4o背后的核心基础设施。

Anthropic技术研发工程师马鲁思·戈亚尔(Maruth Goyal)称,ClickHouse在助力其研发并推出Claude 4的过程中功不可没,为模型训练提供了高速分析能力与灵活的数据处理方案。

OpenAI的案例更具戏剧性。其工程经理阿克沙伊·纳纳瓦蒂(Akshay Nanavati)透露,在2025年3月发布GPT-4o图像生成功能时,服务器一度濒临崩溃,系统CPU使用率瞬间飙升50%。团队通过快速对ClickHouse集群进行扩容化解了危机。随后,仅通过一行代码的优化(将除法运算替换为乘法与位运算组合),系统CPU使用率立即下降了40%。

CPU使用率在代码优化后大幅下降的折线图

CEO卡茨透露,目前ClickHouse仍处于为增长而投资的亏损运营状态。今年1月17日,公司收购了开源的大语言模型可观测平台Langfuse,该平台致力于确保AI输出的准确性、安全性和符合性。此外,ClickHouse也在积极拓展全球市场,通过与Japan Cloud合作进入日本市场,并宣布与微软Azure围绕OneLake建立合作关系。

结语:踩准AI风口,数据库正加速为智能数据扩容

作为AI基础设施的关键一环,数据分析平台的重要性日益凸显。在大模型迭代、多模态应用落地及企业级AI服务普及的浪潮下,产生的日志、监控和性能数据呈指数级增长,这对底层数据分析工具的实时处理、海量存储和复杂查询能力提出了极致要求。

ClickHouse的爆发式增长,正是精准踩中了AI大规模应用的时间节点。其开源架构、云原生弹性、高效列式存储以及对SQL的原生支持,恰好匹配了AI场景下高并发写入、复杂查询和全量数据洞察的核心需求。

从收购Langfuse到升级产品矩阵的布局可以看出,像ClickHouse这样的数据库厂商正在不断拓展自身的能力边界,旨在为企业的AI数据构建一个更统一、更实时、更智能的数据处理底座。这场围绕数据效率的竞赛,仍在加速进行中。

对这类前沿技术实践和案例分析感兴趣的朋友,欢迎到 云栈社区 交流讨论,这里有更多关于数据库、大数据和架构设计的深度内容。




上一篇:TI拟75亿美元全现金收购Silicon Labs,溢价收购背后或重塑无线连接芯片市场格局
下一篇:开源大模型新标杆:9B全双工MiniCPM-o 4.5实战与测评,让AI告别“对讲机”
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-7 07:47 , Processed in 0.427371 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表