近日,由阿里云与蚂蚁集团联合发起的开源项目 Dragonfly 正式通过 Cloud Native Computing Foundation(CNCF,云原生计算基金会)的毕业评审,成功跻身于在全球范围内被广泛采用的成熟基础设施项目行列。

CNCF 致力于构建可持续发展的云原生软件生态,其“毕业项目”是指经过基金会严格评审,被认为具备极高成熟度、可稳定应用于生产级环境的核心开源项目。这一认证标志着项目在代码质量、社区治理、生产可用性及生态贡献等方面都达到了顶尖水平。
Dragonfly 是一个专为以 Kubernetes 为核心的云原生环境设计的镜像和文件分发系统。此次从 CNCF 孵化项目升级为毕业项目,意味着其在稳定性、安全性和社区健康度等多个维度均满足了基金会的最高标准要求。
CNCF 首席技术官 Chris Aniszczyk 对此表示:“Dragonfly 的毕业反映了该项目的成熟度、广泛的行业采用以及在扩展云原生基础设施方面的关键作用。尤其令人兴奋的是看到该项目在镜像加速和 AI 工作负载数据分发方面的价值。我们很自豪能够支持一个不断推动可扩展、高效和开放的社区。”
Dragonfly 项目发展历程
Dragonfly 由阿里云团队于 2017 年开源,其诞生源于阿里内部对超大规模场景下高效数据分发的迫切需求。该项目于 2018 年以沙盒(Sandbox)身份加入 CNCF,随后在 2020 年进入孵化阶段。

自加入 CNCF 以来,Dragonfly 的社区规模显著扩大。贡献者从最初来自 5 家公司的 45 人,增长至目前来自超过 130 家机构的 271 人,代码提交次数也从约 800 次激增至超过 26000 次。滴滴、快手、Intel、Datadog 及智谱 AI 等众多企业已将其集成到生产环境中,证明了其在严苛场景下的可靠表现。

Dragonfly 核心技术亮点
Dragonfly 的核心价值在于其提供的高效、稳定、安全的镜像分发和加速能力。它旨在成为 云原生 架构下的标准和最佳实践,解决传统中心化下载方式在大规模分发时面临的痛点:
- 源站压力巨大:数千节点同时拉取镜像,极易压垮镜像仓库。
- 分发效率低下:大型镜像下载耗时过长,严重影响应用部署与弹性伸缩速度。
- 网络成本高昂:跨区域或跨可用区的重复数据传输带来巨额带宽开销。
为此,Dragonfly 引入了基于点对点(P2P)技术的智能分发方案。在这一模型下,集群中的每一台机器不仅可以从中央源站下载数据,还能作为“种子节点”向其他对等节点共享已下载的数据块。
通过智能调度和分块传输机制,Dragonfly 能够实现:
- 显著降低对源站仓库的带宽压力。
- 将大规模镜像分发的时间从分钟级缩短至秒级。
- 支撑极高并发场景,例如在“双11”等大促期间实现单日数千万次容器启动。
未来规划:聚焦AI等新兴场景
随着生成式 AI 的快速发展,模型体积动辄达到百 GB 乃至 TB 级别,这对训练和推理集群的数据分发效率提出了前所未有的挑战。面向未来,Dragonfly 社区计划在以下方向持续探索与增强:
- 支持 AI 模型标准:推动对 ModelPack 等规范的支持,实现 AI 模型制品的标准化分发。
- 融合高速网络技术:结合 RDMA 等技术,目标在百节点规模下实现百 TB 级模型的分钟级分发。
- 优化数据布局策略:改进数据分块与调度算法,以降低在横向扩展(scale-out)过程中的传输延迟。
从 CNCF 毕业并非终点,而是一个全新发展阶段的开始。Dragonfly 社区未来将重点投入在完善云原生分发标准、深化对 AI 训练、边缘计算等场景的支持,并探索面向下一代超大规模 AI 的数据调度方案。
参与 Dragonfly 社区
Dragonfly 的持续进化离不开开放社区的共同建设。无论你是希望优化集群镜像分发效率的运维工程师,还是需要提升大模型加载速度的 AI 平台开发者,抑或是对云原生技术充满热情的爱好者,都欢迎加入 Dragonfly 社区贡献力量。
项目资源:
欢迎在 云栈社区 与其他开发者交流云原生及 DevOps 领域的实践经验,共同学习成长。
/ END /
|