2月27日,在美国圣克拉拉举行的存储领域顶级会议 USENIX FAST 2026 上,阿里云瑶池数据库 PolarStore 团队的论文 《PolarStore: High-Performance Data Compression for Large-Scale Cloud-Native Databases》 荣获 最佳论文提名(Best Paper Award Candidate)。该成果从全球44篇录用论文(录用率仅17.4%)中脱颖而出,成为仅有的5篇最佳论文候选之一。

阿里云数据库团队创新性地提出了软硬件双层压缩架构,其设计深度契合云原生数据库的I/O特征。这一方案成功打破了数据库与存储系统之间的语义壁垒,消除了传统方案中软硬件压缩功能的重叠冗余,最终实现了高性能、高压缩比与灵活资源调度的统一。基于这项核心技术,阿里云打造了业界首个实现商业化落地的软硬协同压缩产品,并已在云原生数据库的生产环境中完成了大规模部署与应用。该论文由阿里云作为唯一完成单位,系统性地总结了软硬协同压缩在大规模工程实践中的经验与技术洞察,为云数据库的存储优化领域树立了新的标杆。
FAST 会议(USENIX Conference on File and Storage Technologies,文件与存储技术会议)由美国高等计算系统协会(USENIX)和美国计算机学会操作系统专业组织(ACM SIGOPS)联合主办。自2002年创办以来,它一直是存储领域公认的国际顶级学术会议,并被中国计算机学会(CCF)列为A类会议。会议聚焦于文件系统、云存储、新型存储硬件、数据管理等前沿方向,其论文录用标准极为严格,入选成果通常代表着行业的最高研究水平,深受全球学术界与工业界的重视。
PolarDB MySQL/PostgreSQL 版是阿里云自研的云原生数据库,采用了软硬件一体化的设计思路,其高性能存储底座正是PolarStore。它不仅100%兼容MySQL/PostgreSQL,还支持HTAP、多主多写、多活容灾等高级特性。作为PolarDB存储与计算分离架构的核心底座,PolarStore是一款具备超低延迟和高可用能力的分布式存储系统。它采用了轻量的用户空间网络和I/O栈,绕过了传统的操作系统内核瓶颈,从而能够充分发挥RDMA和NVMe SSD等新兴硬件的潜力,极大地降低了分布式数据访问的端到端延迟。
FAST会议评委在点评中指出:“论文通过对现有压缩技术的系统性抽象和对行业痛点的精准洞察,创新性地构建了软硬件协同的双层压缩架构;同时,将超大规模、长期稳定运行的工程实践深度反哺学术界,为硬件架构设计、压缩算法优化及智能调度策略等研究方向提供了兼具理论深度与实践价值的参考范式,彰显了工业界前沿实践对学术创新的重要引领作用。”
论文中提出的软硬件协同压缩方案实现了PolarDB全链路的深度优化协同。在软件层,它深度感知InnoDB Page的边界,以16KB的大块粒度进行压缩,并在全链路I/O中打标;在硬件层,则依托Smart-SSD的变长FTL能力,将压缩后的数据块进行紧凑组织。这种设计使得软硬件逻辑深度融合,彻底消除了传统方案中存在的多层垃圾回收(GC)与I/O放大问题。线上实践验证,该方案的平均压缩比达到了3.55倍,实例级最高压缩比甚至超过10倍,并且实现了零I/O放大,无需垃圾回收。
在性能表现上,该方案在100%兼容InnoDB引擎的前提下,仅对数据Page进行压缩,绕过了Redo/Binlog路径,将CPU开销卸载至存储层,确保了Redo链路的高效与无损。结合其他特性,甚至能实现性能无损或提升。同时,方案支持对压缩算法、压缩粒度及单次I/O策略进行动态调整,软件栈简洁,无后台流量干扰,杜绝了性能抖动。
作为业界首个商业化的软硬双压缩产品,该方案显著降低了云数据库的存储成本与总拥有成本(TCO)。在保障极致稳定性与业务灵活性的同时,为大规模云原生应用提供了一个高效、经济且可靠的存储基石。

PolarStore软硬协同压缩架构示意图
阿里云瑶池数据库团队独立完成的这项研究,系统性地总结了软硬协同压缩的大规模工程实践与技术洞察,为云数据库存储优化树立了新标杆。据了解,阿里云原生数据库PolarDB已规模化应用于政务、金融、电信、物流、互联网及汽车等行业的核心业务系统,服务包括理想汽车、小鹏汽车、MiniMax、GoTo集团、度小满、米哈游等全球知名企业。
这项来自顶尖学术会议的认可,不仅是对阿里云在数据库底层存储技术创新的肯定,也为我们提供了宝贵的行业洞察。对类似的前沿技术实践与工程细节感兴趣的朋友,可以关注云栈社区的相关技术板块,那里汇聚了更多开发者的实战经验与深度讨论。
|