又过了一年。我本想多写几篇文章,而不只是这份年终总结,但春季学期繁忙得差点让人“死掉”,时间总是不够用。尽管如此,我还是要梳理一下,过去一年里数据库领域那些主要的趋势和动向。
数据库世界从不乏令人兴奋且出人意料的发展。“Vibe coding”成了日常用语;Wu-Tang Clan 宣布了时间胶囊项目。今年,Databricks 没有选择上市,而是完成了两轮大规模的融资。
与此同时,另一些事件则在意料之中,没那么让人惊讶。Redis 有限公司在经历“撤地毯”事件一年后,把许可证又改了回来(这个我去年就猜到了)。SurrealDB 公布的基准测试成绩好得惊人,但代价是写入操作不刷盘,存在数据丢失的风险。哦,还有,酷玩乐队(Coldplay)可能毁掉你的婚姻。不过,对于最后这件事,Astronomer 倒是化不利为有利,做得相当不错。
在开始之前,我想先回应一个每年都会在这些文章评论里出现的问题。大家总问,为什么我的分析里没提到某个特定的系统、数据库或公司。我能写的内容有限,而且除非过去一年发生了有趣或值得关注的事情,否则也没啥好讨论的。不过,并非所有值得关注的事件都适合我置评。最近尝试揭露 AvgDatabase CEO 身份的举动尚算合理,但 MongoDB 那桩自杀诉讼案显然就不适合多谈。
好了,闲话少叙,咱们开始吧。这些文章每年都越来越长,先提前道个歉。
往期回顾:
PostgreSQL 的主导地位持续
我在 2021 年首次撰文讨论 PostgreSQL 如何席卷数据库领域。这一趋势依然势不可挡,因为数据库领域大多数最引人注目的发展,再次聚焦于 PostgreSQL。这款数据库管理系统(DBMS)的最新版本 v18 于 2025 年 11 月发布。最突出的特性是全新的异步 I/O 存储子系统,这最终将使 PostgreSQL 逐步摆脱对操作系统页面缓存的依赖。该版本还新增了对跳跃扫描的支持:即便查询条件缺少索引的前导列,也能利用多列 B+ 树索引。查询优化器也有一些额外改进(例如,移除多余的自连接)。
精明的数据库行家会立刻指出,这些并非突破性功能,其他 DBMS 多年前就已具备。PostgreSQL 是唯一仍重度依赖操作系统页面缓存的主流数据库。而且,Oracle 早在 2002 年(v9i 版本)就支持跳跃扫描了!那么,你可能会疑惑,为什么我说 2025 年数据库领域最热的动态发生在 PostgreSQL 身上?
原因在于,绝大部分的行业能量和商业活动,都涌向了围绕 PostgreSQL 的公司、产品、项目和衍生系统。
收购与发布
去年,最热门的数据初创公司(Databricks)以 10 亿美元收购了一家 PostgreSQL 数据库即服务(DBaaS)公司(Neon)。接着,全球最大的数据库公司之一(Snowflake)以 2.5 亿美元收购了另一家 PostgreSQL DBaaS 公司(CrunchyData)。随后,全球最大的科技公司之一(微软)推出了一款新的 PostgreSQL DBaaS(HorizonDB)。Neon 和 HorizonDB 沿用了亚马逊 Aurora 在 2010 年代首创的经典架构,采用计算与存储分离的单主节点模式。目前,Snowflake 的 PostgreSQL DBaaS 则采用与标准 PostgreSQL 相似的核心架构,毕竟它基于 Crunchy Bridge 构建。
分布式 PostgreSQL
我上面列出的所有服务都是单主架构。也就是说,应用将写入发送到主节点,再由主节点同步到只读副本。但在 2025 年,有两个新项目宣布,旨在为 PostgreSQL 创建可横向扩展(即水平分片)的服务。
2025 年 6 月,Supabase 宣布已聘请 Vitess 的联合创始人、前 PlanetScale 联合创始人兼 CTO Sugu 来领导 Multigres 项目,目标是为 PostgreSQL 创建分片中间件,类似于 Vitess 为 MySQL 所做的那样。Sugu 于 2023 年离开 PlanetScale,之后沉寂了两年。如今,他可能已解决所有法律问题,准备在 Supabase 大展拳脚。当一位数据库工程师加入某公司,而公告更聚焦于这个人而非系统本身时,你就知道事情不简单。相比之下,SingleStore 的联合创始人兼 CTO 在 2024 年加入微软领导 HorizonDB 项目时,微软(错误地)并未大张旗鼓地宣传。Sugu 加入 Supabase,就好比老牌说唱歌手在两年后获得假释,出狱第一天就宣布签下新的唱片合约。
Multigres 的消息发布一个月后,PlanetScale 宣布了自家适用于 PostgreSQL 的 Vitess 项目——Neki。PlanetScale 在 2025 年 3 月推出了其最初的 PostgreSQL DBaaS,但核心架构是带有连接池 pgBouncer 的单节点标准 PostgreSQL。
2026 年 1 月 5 日更新:有人通过私人邮件提醒我,PgDog 也是另一个旨在支持 PostgreSQL 水平分片的开源中间件系统。我原本在心里把 PgDog 归到与连接池代理(如 PgBouncer)同一类,但实际上它是 Multigres 和 Neki 的竞争对手。
商业格局
随着微软在 2025 年推出 HorizonDB,所有主要的云供应商现在都有了针对自家 PostgreSQL 产品的重要项目。亚马逊自 2017 年起提供 Aurora PostgreSQL。谷歌在 2022 年推出了 AlloyDB。ServiceNow 基于其 2021 年对 Swarm64 的收购,于 2024 年推出了 RaptorDB 服务。即便是像“老式翻盖手机”般的 IBM,也自 2018 年起拥有了其 PostgreSQL 的云版本。甲骨文在 2023 年发布了其 PostgreSQL 服务,不过有传言称,其内部的 PostgreSQL 团队在 2025 年 9 月的 MySQL OCI 裁员中受到了波及。
目前仍有少数独立的(ISV)PostgreSQL DBaaS 公司。就实例数量而言,Supabase 可能是其中规模最大的。其他公司还包括 YugabyteDB、TigerData(前身为 Timescale)、PlanetScale、Xata、PgEdge 和 Nile。Xata 最初的架构建立在亚马逊 Aurora 之上,但今年该公司宣布将转向自建基础设施。ParadeDB 尚未宣布其托管服务。Tembo 在 2025 年放弃了其托管的 PostgreSQL 产品,转而开发一种能进行某些数据库调优的编码代理。Hydra 和 PostgresML 在 2025 年倒闭(参见“消亡”部分),因此已退出竞争。其他系统提供与 Postgres 兼容的前端,但后端并非源自 PostgreSQL(例如 CockroachDB、CedarDB、谷歌 Spanner)。还有一些托管公司在提供其他系统的同时也提供 PostgreSQL DBaaS,例如 Aiven 和 Tessel。
适用于每个数据库的 MCP!
如果说 2023 年是每个 DBMS 都添加向量索引的一年,那么 2025 年就是每个 DBMS 都开始支持 Anthropic 的模型上下文协议(MCP)的一年。
MCP 是一种标准化的客户端-服务器 JSON-RPC 接口,它能让大型语言模型(LLMs)与外部工具和数据源进行交互,而无需自定义粘合代码。MCP 服务器充当 DBMS 前端的中间件,向 LLM 展示可用的工具、数据和操作列表。MCP 客户端(例如 Claude 或 ChatGPT 等 LLM 主机)通过向服务器发送请求来发现并使用这些工具,从而扩展其能力。在数据库场景中,MCP 服务器会将自然语言查询转换为相应的数据库查询(如 SQL)或管理命令。简单说,MCP 就像一个中间人,负责理清头绪,让数据库和 LLM 能够顺畅协作。
Anthropic 于 2024 年 11 月发布了 MCP,但其真正兴起是在 2025 年 3 月,当时 OpenAI 宣布将在其生态系统中支持 MCP。在接下来的几个月里,每家 DBMS 供应商都为所有系统类别发布了 MCP 服务器:联机分析处理(OLAP,如 ClickHouse、Snowflake、Firebolt、Yellowbrick)、SQL(如 YugabyteDB、Oracle、PlanetScale)以及 NoSQL(如 MongoDB、Neo4j、Redis)。由于没有官方的 PostgreSQL MCP 服务器,每个 Postgres DBaaS 都发布了自己的 MCP 服务器(例如 Timescale、Supabase、Xata)。云供应商发布了多数据库 MCP 服务器,可与他们的任何托管数据库服务通信(例如亚马逊、微软、谷歌)。允许单一网关与异构数据库通信,这几乎(但还不完全是)实现了联邦数据库的圣杯。据我所知,这些 MCP 服务器中的每个请求一次只能针对单个数据库,因此跨源连接的操作仍需由应用程序处理。
除了官方供应商的实现,几乎每个 DBMS 都有数百种社区版的 MCP 服务器实现。其中一些尝试支持多个系统(例如 DBHub、DB MCP 服务器)。DBHub 发布了一份关于 PostgreSQL MCP 服务器的出色概述。
一个被证明对 AI 代理特别有用的功能是数据库分支。尽管这不是 MCP 服务器独有的,但分支功能允许代理快速测试数据库更改,而不会影响生产应用。Neon 在 2025 年 7 月报告称,其 80% 的数据库是由代理创建的。Neon 从一开始就设计为支持分支(Nikita 在该系统还叫“Zenith”时给我展示过早期演示),而其他系统则是后来才增加了对此功能的支持。可以参阅 Xata 最近关于数据库分支的比较文章。
MongoDB, Inc. 诉 FerretDB 公司案
MongoDB 作为 NoSQL 的中坚力量已有二十年。FerretDB 由 Percona 高层于 2021 年推出,旨在提供一个中间件代理,将 MongoDB 查询协议转换为 SQL,并以后端 PostgreSQL 作为存储引擎。该代理允许 MongoDB 应用程序无需重写查询就能切换到 PostgreSQL。
两者相安无事几年,直到 2023 年 MongoDB 向 FerretDB 发出禁止函,声称后者侵犯了其专利、版权和商标权,并违反了 MongoDB 关于其文档和有线协议规范的许可。这封信于 2025 年 5 月被公开,当时 MongoDB 就这些问题对 FerretDB 提起了联邦诉讼,采取了强硬措施。他们的部分不满在于,FerretDB 四处宣称自己是 MongoDB 的“即插即用替代品”,但并未获得授权。MongoDB 的法庭文件包含了所有常见的指控:(1)误导开发者;(2)淡化商标;(3)损害其声誉。
微软宣布将其与 MongoDB 兼容的 DocumentDB 捐赠给 Linux 基金会,这让事情变得更加复杂。该项目网站提到,DocumentDB 与 MongoDB 驱动程序兼容,其目标是“构建一个与 MongoDB 兼容的开源文档数据库”。其他主要数据库供应商,如亚马逊和 Yugabyte,也参与了该项目。乍一看,这种说法似乎与 MongoDB 指控 FerretDB 的内容相似。
文件格式战场
文件格式是数据系统中一个在过去十年基本处于停滞状态的领域。2011 年,Meta 发布了一种面向 Hadoop 的列式格式,名为 RCFile。两年后,Meta 改进了 RCFile,并公布了基于 PAX 的 ORC(优化行列式)格式。在 ORC 发布一个月后,Twitter 和 Cloudera 发布了 Parquet 的第一个版本。近 15 年后,Parquet 成为了占主导地位的开源文件格式。
2025 年,发布了五种新的开源文件格式,试图挑战 Parquet 的地位:
- CWI FastLanes
- CMU + Tsinghua F3
- SpiralDB Vortex
- The Germans' AnyBlox
- Microsoft Amudai
这些新格式加入了 2024 年发布的其他格式:
- Meta Nimble
- LanceDB Lance
- IoTDB TsFile
SpiralDB 今年最为引人注目,他们宣布将 Vortex 捐赠给 Linux 基金会,并成立了跨组织指导委员会。微软在 2025 年底的某个时候悄然终止了 Amudai(或者至少将其闭源了)。其他项目(FastLanes、F3、Anyblox)都是学术原型。Anyblox 今年获得了 VLDB 最佳论文奖。
这场新的竞争激发了 Parquet 开发者社区对其功能进行现代化改造的热情。请参阅 Parquet PMC 主席(Julian Lademann)对列式文件格式领域的深入技术分析。
随机事件
数据库是笔大生意。让我们把它们都过一遍!
收购
这个领域动作频频。Pinecone 在 9 月更换了 CEO,为被收购做准备,但我没再听到后续消息。以下是已经发生的几起:
- DataStax → IBM
这家 Cassandra 领域的老牌企业在年初被 IBM 以约 30 亿美元收购。
- Quickwit → DataDog
作为 Lucene 替代品——全文搜索引擎 Tantivy 背后的领先公司,在今年年初被收购。好消息是,Tantivy 的开发仍在积极进行。
- SDF → dbt
这次收购是 dbt 今年“Fusion”发布活动的一部分,是一项稳健的举措。这使他们能够在其数据流图(DAGs)中进行更严谨的 SQL 分析。
- Voyage.ai → MongoDB
Mongo 收购了一家早期 AI 公司,以扩展其云服务中的 RAG 能力。我最优秀的学生之一在公告发布前一周加入了 Voyage。他原本以为不与数据库公司签约是在违背“家族传统”,结果最终还是进了一家数据库公司。
- Neon → Databricks
显然,这家 PostgreSQL 公司曾引发一场竞标大战,不过 Databricks 以令人瞩目的 10 亿美元将其收入囊中。Neon 如今仍是一项独立服务,但 Databricks 很快在其生态系统中将其重新命名为 Lakebase。
- CrunchyData → Snowflake
Snowflake 可不会让 Databricks 在夏天独占风头,所以他们斥资 2.5 亿美元收购了有着 13 年历史的 PostgreSQL 公司 CrunchyData。近年来,Crunchy 吸纳了顶尖的前 Citus 人才,并且在被收购前就一直在拓展自身的 DBaaS 业务。Snowflake 于 2025 年 12 月宣布了其 Postgres 服务的公开预览版。
- Informatica → Salesforce
20 世纪 90 年代的老牌 ETL 公司 Informatica 以 80 亿美元被 Salesforce 收购。该公司曾于 1999 年上市,2015 年回归私募股权,2021 年再次上市。
- Couchbase → Private Equity
说实话,我一直不明白 Couchbase 是怎么在 2021 年上市的。我猜他们是沾了 MongoDB 的光?几年前,Couchbase 做了一些有意思的工作,整合了加州大学欧文分校 AsterixDB 项目的组件。
- Tecton → Databricks
Tecton 为 Databricks 提供了额外的工具来构建 AI 代理。我还有一位以前的学生曾在这家公司工作,现在在 Databricks 任职。
- Tobiko Data → Fivetran
这个团队研发了两个实用工具:SQLMesh 和 SQLglot。前者是唯一能与 dbt 抗衡的可行开源替代品(详见下文关于他们与 Fivetran 即将进行的合并)。SQLglot 是一款便捷的 SQL 解析器/反解析器,支持基于启发式的查询优化。未来几年,Fivetran 中的这一工具与 SDF 及 dbt 的结合,将在该领域形成有趣的技术布局。
- SingleStore → Private Equity
收购 SingleStore 的私募股权公司(Vector Capital)在管理数据库公司方面有过经验。他们此前在 2020 年收购了 XML 数据库公司 MarkLogic,并于 2023 年将其转卖给了 Progress 公司。
- Codership → MariaDB
2024 年被私募股权公司收购后,MariaDB 公司今年开始了一系列收购。首先收购的是为 MariaDB 开发 Galera Cluster 横向扩展中间件的公司。详见我 2023 年对 MariaDB 一团糟状况的概述。
- SkySQL → MariaDB
然后是 MariaDB 的第二笔收购。捋一下时间线:2010 年,最初支持 MariaDB 的商业公司名为“SkySQL 公司”,但在 2014 年更名为“MariaDB 公司”。之后在 2020 年,MariaDB 公司推出了一款名为 SkySQL 的 MariaDB DBaaS。但由于资金流失严重,MariaDB 公司在 2023 年将 SkySQL 业务分拆为一家独立公司。而现在,到了 2025 年,MariaDB 公司兜了一圈,又回购了 SkySQL 公司。今年的数据库宾果卡上,我可没料到会有这一出。
- Crystal DBA → Temporal
这家自动化数据库优化工具公司加入了 Temporal,以自动优化他们的数据库!很高兴听到 Crystal 的创始人、伯克利数据库组校友 John Schiller-Smith 在那里一切顺利。
- HeavyDB → Nvidia
该系统(前称 OmniSci,前称 MapD)是最早的 GPU 加速数据库之一,于 2013 年推出。除了一家并购公司列出了这笔交易外,我找不到他们被收购的官方公告。之后我们与英伟达召开了一次会议,讨论潜在的数据库研究合作,一些 HeavyDB 的朋友也出席了。
- DGraph → Istari Digital
Dgraph 此前于 2023 年被 Hypermode 收购。看起来 Istari 只是收购了 Dgraph,而没有收购 Hypermode 的其他部分(或者说他们放弃了其他部分)。我至今还没遇到过任何正在积极使用 Dgraph 的人。
- DataChat → Mews
这是威斯康星大学、现任卡内基梅隆大学数据库教授 Jignesh Patel 推出的首批“与数据库对话”项目之一。但他们被一家欧洲酒店管理 SaaS 公司收购了。你怎么理解都行。
- Datometry → Snowflake
Datometry 多年来一直致力于解决将传统 SQL 方言(例如 Teradata)自动转换为较新的 OLAP 系统这一棘手问题。Snowflake 收购了他们,以扩展其迁移工具。更多信息请参见 Datometry 在 2020 年的 CMU-DB 技术讲座。
- LibreChat → ClickHouse
就像 Snowflake 收购 Datometry 一样,ClickHouse 此次的收购是一个很好的例子,它体现了如何通过改善开发者体验来增强一款高性能通用 OLAP 引擎。
- Mooncake → Databricks
收购 Neon 之后,Databricks 收购了 Mooncake,以实现 PostgreSQL 对 Apache Iceberg 数据的读写。更多信息请参见他们 2025 年 11 月的 CMU-DB 演讲。
- Confluent → IBM
这是如何从一个草根开源项目发展成一家公司的典型范例。Kafka 最初是 2011 年在 LinkedIn 开发的。随后,Confluent 于 2014 年作为一家独立的初创公司分拆出来。七年后的 2021 年,他们进行了 IPO。之后,IBM 开出巨额支票收购了它。与 DataStax 的情况类似,目前尚不清楚 IBM 会像对待其收购的其他公司那样对待 Confluent,还是 Confluent 能够像红帽(RedHat)那样保持自主性。
- Gel → Vercel
他们以前叫 EdgeDB,基于 PostgreSQL 提供领域特定语言(DSL),该技术/公司在年底被 Vercel 收购。
- Kuzu → ???
滑铁卢大学的嵌入式图数据库管理系统(DBMS)于 2025 年被一家未具名的公司收购。随后,KuzuDB 公司宣布将放弃这个开源项目。LadybugDB 项目则试图对 Kuzu 的代码进行分支维护。
合并
2025 年 10 月传来意外消息,Fivetran 和 dbt Labs 宣布合并,成立一家新公司。
我能想到的数据库领域最近一次合并是 2019 年 Cloudera 与 Hortonworks 的合并。但那笔交易就像是厨房里被踩碎的劣质钥匙:两家在 Hadoop 市场中难以找到存在感的公司合并成一家,试图借此找到市场定位(剧透一下:它们并没有成功)。2022 年,MariaDB 公司通过与 Angel Pond 控股公司的 SPAC 合并严格来说也算一次,但那笔交易的目的是让 MariaDB 能够通过后门方式实现 IPO。而且,这对投资者来说结局并不好。
Fivetran 与 dbt 的合并则与这两起不同(而且更好)。它们是两家互补的科技公司,合并后将成为一家 ETL 巨头,并准备在不久的将来进行合法的 IPO。
融资情况
- Databricks - 40亿美元 L 轮
- Databricks - 10亿美元 K 轮
- ClickHouse - 3.5亿美元 C 轮
- Supabase — 2亿美元 D 轮
- Timescale - 1.1亿美元 C 轮
- Supabase — 1亿美元 E 轮
- Astronomer - 9300万美元 D 轮
- Tessel - 6000万美元 B 轮
- LanceDB - 3000万美元 A 轮
- Convex - 2400万美元 B 轮
- SpiralDB - 2200万美元 A 轮
- ParadeDB - 1200万美元 A 轮
- CedarDB - 590万美元
- TopK - 550万美元
- Columnar - 400万美元
- SereneDB - 210万美元
- Starburst — 未公开 ?
- TurboPuffer - 未公开 ?
名称变更
我每年的文章中新增了一个类别,就是数据库公司更改其公司或系统的名称。
- HarperDB → Harper
这家 JSON 数据库公司去除了名称中的“DB”后缀,以强调其作为数据库支持的应用平台的定位,类似于 Convex 和 Heroku。我喜欢 Harper 的员工们。他们在 2021 年 CMU-DB 技术讲座上提出了我所听过的最糟糕的 DBMS 想法。值得庆幸的是,当他们意识到这个想法有多糟糕时,就放弃了它,转而采用了 LMDB。
- EdgeDB → Gel
这是一个明智的举措,因为“Edge”这个名称容易让人误解它是适用于边缘设备或服务(例如 Fly.io)的数据库。但我不确定“Gel”能否传达该项目更高层次的目标。可以看看卡内基梅隆大学(CMU)一位博士校友在 2025 年 CMU-DB 关于 Gel 查询语言(仍称为 EdgeQL)的演讲。
- Timescale → TigerData
一家数据库公司为了将自己与其主要的数据库产品区分开来而进行更名,这种情况实属罕见。通常情况下,公司会将自己更名为数据库的名称(例如,“Relational Software, Inc.” 更名为 “Oracle Systems Corporation”,“10gen, Inc.” 更名为 “MongoDB, Inc.”)。但对于这家公司而言,试图摆脱“专门的时间序列 DBMS”这一印象,转而树立“面向通用应用、经过改进的 PostgreSQL”的形象,是合情合理的,因为前者的市场细分规模比后者小得多。
消亡
坦白说,我曾是其中两家失败初创公司的技术顾问。我作为顾问的成功率目前低得可怜。我也曾担任 Splice Machine 的顾问,但他们在 2021 年停业了。说句辩解的话,我和这些公司只讨论技术理念,不涉及商业策略。而且我确实告诉过 Fauna,他们应该增加 SQL 支持,但他们没有采纳我的建议。
- Fauna
一个基于 Dan Abadi 关于确定性并发控制研究的有趣分布式 DBMS。就在 NoSQL 热潮逐渐消退之际,他们提供了强一致性事务,而 Spanner 让事务再次变得热门起来。但他们有自己的专有查询语言,并且在 GraphQL 上下了很大的赌注。
- PostgresML
这个想法似乎显而易见:让人们能够在其 PostgreSQL DBMS 内部运行 ML/AI 操作。挑战在于说服人们将其现有的数据库迁移到他们的托管平台。他们力推 pgCat 作为代理来镜像数据库流量。其中一位联合创始人加入了 Anthropic,另一位联合创始人则创建了一个名为 pgDog 的新代理项目。
- Derby
这是最早用 Java 编写的 DBMS 之一,其历史可追溯至 1997 年(最初名为“Java DB”或“JBMS”)。2000 年代,IBM 将其捐赠给了 Apache 基金会,并更名为 Derby。2025 年 10 月,该项目宣布系统将进入“只读模式”,因为已经没有人再积极维护它了。
- Hydra
尽管目前尚未有关于这家“DuckDB-in-Postgres”初创公司倒闭的官方公告,但该公司的联合创始人和员工已分散到其他公司。
- MyScaleDB
这是 ClickHouse 的一个分支,增加了向量搜索和使用 Tantivy 的全文索引功能。他们宣布将于 2025 年 5 月关闭。
- Voltron Data
这本该是数据库公司中的“全明星阵容”。可以把它想象成拥有“Run the Jewels”那样的梦幻组合。团队里有来自英伟达 Rapids 的顶尖工程师、Apache Arrow 和 Python Pandas 的发明者,以及来自 BlazingSQL 的秘鲁 GPU 奇才。此外,还有来自顶级公司的 1.1 亿美元风险投资,其中包括英特尔未来的 CEO(同时也是 CMU 的董事会成员)。他们开发了一款 GPU 加速数据库(Theseus),但未能及时推出产品。
最后,尽管这并非一家企业,但如果不提 IBM 阿尔马登研究中心的关闭,我会感到失职。IBM 于 1986 年建立了这个研究中心,几十年来,它一直是数据库研究的圣地。2013 年我去阿尔马登面试时,发现那里的景色很美。IBM 研究数据库小组已不复当年之勇。尽管如此,这片神圣的数据库研究之地的校友名单依然令人印象深刻:Rakesh Agrawal, Donald Chamberlin, Ronald Fagin, Laura Haas, C. Mohan, Pat Selinger, Moshe Vardi, Jennifer Widom 以及 Guy Lohman。
要说数据库元老拉里・埃里森这一年可真是辉煌。这位 81 岁的老人一年内取得的成就,比大多数人一辈子还要多。我会按时间顺序把这一切都讲一遍。
拉里在年初时位列全球富豪榜第三。想到自己的身家比马克・扎克伯格少,他就彻夜难眠。有人说,拉里失眠是因为他买下了一家著名的英国酒吧后改变了饮食习惯,吃了更多馅饼。但我可以保证,拉里的“鱼素”饮食三十年来从未改变。之后,在 2025 年 4 月,我们得知拉里成为了全球第二富有的人。他的睡眠状况有所好转,但仍不尽如人意。而且,他生活中还有很多事情让他倍感压力。比如,拉里最终决定卖掉他那辆罕见的、半符合上路规定的迈凯伦 F1 超级跑车,手套箱里还放着原车主手册。
2025 年 7 月,拉里发布了他 13 年来的第三条推文(像我这样的拉里粉丝称其为“#3”)。这条推文是关于他在牛津大学附近创办的埃里森理工学院(EIT)的最新情况。从 EIT 这个名字以及它与牛津大学的关联来看,它听起来像是一个纯粹的研究性非营利机构,类似于斯坦福大学的 SRI 或卡内基梅隆大学的 SEI。但事实证明,它是一个伞形组织,旗下有一系列营利性公司,这些公司由一家总部位于加利福尼亚的有限责任公司所有。当然,一群怪人在 #3 下面回复,承诺要实现区块链驱动的低温冷冻技术或室温超导体。拉里告诉我他不理会这些。不过,也有理解其中商业逻辑的人。
今年(或许是本世纪)最重大的数据库新闻于美国东部时间 9 月 10 日星期三下午 3 点左右传来。在等待了数十年之后,拉里・约瑟夫・埃利森终于被加冕为世界首富。当天上午,$ORCL 的股价上涨了 40%,由于拉里仍持有该公司 40% 的股份,他的总资产估计达到 3930 亿美元。从这个角度来看,这不仅使拉里成为世界上最富有的人,也成为了人类历史上最富有的人。经通胀调整后,约翰・D・洛克菲勒和安德鲁・卡内基(没错,就是卡内基梅隆大学中那个“C”)的巅峰净资产分别仅为 3400 亿美元和 3100 亿美元。
除了拉里登上世界之巅,甲骨文公司还参与了对控制 TikTok 的美国公司的收购,并且拉里为派拉蒙(由他第四次婚姻所生的儿子控制)收购华纳兄弟的竞标提供资金支持。由于拉里是派拉蒙的大股东,美国总统甚至还劝说他接管 CNN 的新闻部门。
结论
在结束之前,我想快速地表达一些感谢并给出一些建议。首先要感谢 PT,在特殊时期凭借 Turso 把数据库管理得井井有条(外面见)。向 JT 表示慰问,他因为私下搞 KevoDB 数据库副业而丢了工作。另外,务必只在数据库中放入虚假数据用于测试,不要把这些数据以 1.75 亿美元的价格卖掉,结果落得个七年监禁的下场。
我和我的博士生们也成立了一家新创业公司。我希望很快能多说一些。说到做到。
回顾这一年,数据库领域的格局在资本、技术和法律层面都经历了剧烈的震动。从 PostgreSQL 生态的持续繁荣与分化,到 MCP 协议试图统一 AI 与数据的交互方式,再到文件格式领域久违的“诸神之战”,无不显示出这个古老而又常新的领域依然活力四射。同时,我们也目睹了巨头的并购、初创的兴衰,以及传奇人物拉里・埃里森登上财富之巅。这些故事共同构成了 2025 年数据库世界的全景图。作为技术人员,持续关注并理解这些趋势,无疑能帮助我们在构建系统时做出更明智的选择。想了解更多深入的技术讨论和行业分析,欢迎到 云栈社区 交流。
原文:Databases in 2025: A Year in Review
引用链接:
[1] 死掉: https://bsky.app/profile/andypavlo.bsky.social/post/3lsvwhx2ixk2v
[2] Vibe coding : https://twitter.com/karpathy/status/1886192184808149383
[3] 两轮大规模融资: https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html#random-fundings
[4] 2024年数据库:一年回顾: https://www.cs.cmu.edu/~pavlo/blog/2025/01/2024-databases-retrospective.html
[5] 2023年数据库:一年回顾: https://www.cs.cmu.edu/~pavlo/blog/2024/01/2023-databases-retrospective.html
[6] 2022年数据库:一年回顾: https://www.cs.cmu.edu/~pavlo/blog/2022/12/2022-databases-retrospective.html
[7] 2021年数据库:一年回顾: https://www.cs.cmu.edu/~pavlo/blog/2021/12/2021-databases-retrospective.html
[8] CWI FastLanes: https://github.com/cwida/FastLanes
[9] CMU + Tsinghua F3: https://github.com/future-file-format/f3
[10] SpiralDB Vortex: https://vortex.dev/
[11] The Germans' AnyBlox: https://github.com/AnyBlox
[12] Microsoft Amudai: https://web.archive.org/web/20250802074742/https://github.com/microsoft/amudai
[13] Meta Nimble: https://github.com/facebookincubator/nimble
[14] LanceDB Lance: https://lancedb.com/blog/lance-v2/
[15] IoTDB TsFile: https://tsfile.apache.org/
[16] Databases in 2025: A Year in Review: https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html#random-fundings