云栈社区»论坛 › 站务中心「 Forum Service 」 › Zilliz Vector Lakebase 预览版发布：五大核心升级打造 AI 语义 ...

发回帖发新帖

5130 积分	0 好友	725 主题

发消息

Zilliz Vector Lakebase 预览版发布：五大核心升级打造 AI 语义数据底座

发表于 2026-5-26 02:44:49 | 查看: 108| 回复: 0

Vector Lakebase 系统架构图：展示 S3 存储、Hot Cache 与按需计算架构

作为全球向量数据库领域的领导者，Zilliz Cloud 此刻迎来重要版本升级，正式对外推出 Zilliz Vector Lakebase 的 Public Preview 版本。

Zilliz Vector Lakebase 是一个以语义数据为核心的数据平台。它基于 S3 的统一数据底座，将开放存储与弹性计算融合起来，帮助用户在 GB 到 PB 级别数据规模上构建完整的 AI 数据闭环。在同一套架构中，它可以支撑数据全生命周期的三大类负载：

为对延迟要求极高的生产服务提供实时检索功能；
用于交互式、多步骤探索的迭代发现；
用于离线数据挖掘和数据集优化的批量分析。

为此，当前阶段的 Zilliz Vector Lakebase 主要围绕五个方面进行了能力建设：

服务能力升级：推出分层服务方案，为极致性能、容量优化和低成本分层存储等不同场景提供对应选择。
按需搜索能力升级：推出按需搜索（On‑Demand Search），让大规模低频检索、数据探索和离线分析不再需要长期维持闲置计算资源。
数据湖搜索能力升级：支持外部数据湖搜索，可直接在已有数据湖上增加高性能索引和大规模搜索能力。
检索能力升级：在同一系统内支持向量搜索、全文搜索、JSON 查询、地理空间搜索、多向量搜索、多路径检索和重排序。
湖原生存储能力升级：同构统一的 Lake‑Native Storage，基于 Vortex 开放格式，为在线服务和离线分析提供统一、高效、低成本的数据底座。相比 Lance 和 Parquet，它能提供更快、更便宜的随机读取，以及按列格式的灵活性和更宽泛的数据建模能力。

Vector Lakebase 架构示意图：从向量数据库到 Vector Lakebase 的分层结构

以下是此次 Zilliz Vector Lakebase 发布内容的详细介绍。

01 为什么我们需要 Vector Lakebase 做统一的数据基础设施

随着 Agent 系统和 AI 应用进入真实业务场景，我们在生产环境中常常要处理以下三类数据：

底层是原始多模态数据，例如文本、图片、音频、视频和文档。

上层两类数据分别是用于在线服务的语义数据——如文本、向量和标签，以及生产环境中持续积累的反馈数据——例如用户行为、日志、agent notes 和统计信息。

AI 数据闭环：Agent 与 Model 处理的三类负载

基于这些数据，在一个完整的数据生命周期闭环（在线服务 → 知识与反馈沉淀 → 洞察发现 → 数据集与策略优化 → 更高质量的在线服务）里，同一批数据通常需要面临三大类负载：

第一类是实时检索，用于对延迟敏感的生产级在线服务。我们常见的电商推荐、企业知识库，都是典型的在线实时检索。

第二类是交互式探索，用于交互式、多步骤的数据探索和问题定位。比如，AI 开发者需要分析 feedback data 和底层语料，找出服务质量下降的原因；agentic system 也可能自动探索日志和用户行为，定位知识缺口、策略问题或数据稀疏区域。

第三类是批量分析，用于离线挖掘、数据集优化和大规模语义分析。自动驾驶的数据挖掘，模型训练中的数据去重，都是典型代表。

然而过去，这些数据常常分散在不同 pipeline 和系统里，缺少统一、结构化的数据平面来支撑完整工作流。

第一类实时检索可以交给向量数据库解决，但当应对第二类交互式探索、第三类批量分析时，更擅长生产环境中低延迟、高质量向量搜索的向量数据库，就会出现一定的资源冗余与不必要的成本开支。传统的大数据处理同样难以胜任这两类任务——它们的核心计算不是数值计算，而是语义计算，数据主要由 vectors、text、labels 和 semantic metadata 组成，核心操作包括 vector search、full‑text search、reranking、semantic clustering 以及其他 semantic retrieval tasks，这些并不是传统大数据处理的典型负载。

但交互式发现和批量分析在数据层和计算层，其实都与向量数据库天然契合。因此，在许多情况下，在线服务和离线处理完全可以共享相同的底层数据基础。

Zilliz Vector Lakebase 要解决的正是这个问题。它提供一个统一的零拷贝语义数据平面，让实时检索、交互式探索和批量分析同时访问同一份底层数据，减少重复迁移、重复建模和重复计算，使 AI 应用从“能检索”走向“能持续优化”。

02 亮点一：服务能力升级——面向不同负载的分层服务方案

在真实场景中，不同业务对吞吐、延迟、召回率和成本的要求并不一样。为此，Zilliz Cloud（Vector Lakebase）提供的分层服务方案包含三类服务层级：

性能优先层（Performance‑Optimized）
容量优化层（Capacity‑Optimized）
分层存储层（Tiered‑Storage）

每个层级都配备专门的索引算法和数据存取策略，并针对不同存储层做了数据布局优化，从而在性能和成本之间提供不同选择。

三层存储方案：性能优化、容量优化、分层存储的硬件组合

性能优先层：面向极致性能场景

性能优先层面向对实时性要求最高的检索场景。该层将数据直接放在内存中提供服务，可实现 1000+ QPS 和个位数毫秒级延迟。通过多副本部署，吞吐能力还可以继续线性扩展。适合场景包括：高并发 AI 搜索、低延迟 agent 记忆检索、高吞吐推荐系统、对响应时间极其敏感的企业级检索服务。

容量优化层：面向性能与容量平衡场景

容量优化层结合内存和本地 NVMe 存储，在性能和容量之间取得平衡。该层可支持 100 到 500 QPS，并保持 100 毫秒以内延迟，适合大多数生产级检索工作负载。适合场景包括：企业级 RAG 知识库、多租户 SaaS 检索服务、中高频业务数据检索、需要兼顾性能与数据规模的 AI 应用。

分层存储层：面向海量数据与成本敏感场景

分层存储层横跨内存、本地 NVMe 和对象存储。通过高度优化的预取和缓存策略，超过 95% 的数据访问仍然可以命中内存或本地磁盘。在显著降低基础设施成本的同时，可提供 10 到 50 QPS 和约 100 毫秒延迟。适合场景包括：长尾内容检索、历史归档数据查询、大规模低频知识库、冷热数据比例悬殊的生产系统、秒级冷热数据动态调度、100B+ 规模的自动驾驶数据挖掘以及模型训练数据去重 pipeline。

三种服务层级默认提供 95% 到 98% 召回率，并支持通过索引和搜索参数灵活调优。用户可以根据业务需求，在 90% 到 99%+ 召回率区间内平衡准确率、延迟和成本。

对于 online serving，Zilliz Cloud 还提供 Global Cluster，用于跨区域高可用和灾难恢复，并提供 99.99% uptime SLA。

03 亮点二：按需搜索能力升级——大规模语义检索不再为闲置资源买单

很多 AI 团队的数据规模，其交互式探索以及批量分析部分的负载，通常十倍乃至百倍千倍大于在线服务真正需要常驻访问的部分。尤其当用户反馈、智能体笔记、日志和爬取语料都被纳入系统后，数据规模很容易达到 TB 甚至 PB 级。

计算资源使用图：高峰期与空闲期的对比

但这部分任务通常不是 7×24 小时持续运行的。如果为了服务这些数据而长期运行几百甚至几千个向量数据库节点，通常很难从成本收益上算得过来。更重要的是，这类 workload 通常是任务驱动型：只有在执行数据探索、质量分析、离线挖掘或数据集优化时，才需要大量计算资源。其余时间，计算资源大部分处于闲置状态，idle time 往往超过 97%。

过去，应对这种场景，部分用户会选择 Serverless serving 模式，但这对这类负载的成本优化来说，通常不甚明显，有时甚至会带来负向成本优化。常规 Serverless 系统虽然也接近按量付费，但往往会把资源池开销、索引成本和持久化数据成本包装进额外的写入费用和存储费用中。用户看到的是更黑盒的价格，而不是底层资源成本本身。

Zilliz On‑Demand Search 则直接围绕对象存储和按需计算计费。它更接近 AWS Lambda 的使用模式，主要根据分配资源大小和执行时间收费，而存储成本接近底层 S3 成本。

下面是我们做的一个对比：一个包含 10 亿个 768 维向量的数据集，连同数据和索引文件约占 6TB 存储。如果一个月内累计实际计算时间为 10 小时，按需搜索的总成本约为 Serverless 的 1/15，即 318 美元对 4,937 美元。

Serverless 与 On‑Demand Search 成本对比柱状图

对于大规模语义探索和离线分析，这意味着用户不必再为长期闲置的计算资源持续买单。

04 亮点三：外部数据湖搜索——不用搬迁数据，也能获得高性能语义检索能力

当下，很多企业已经建设了成熟的数据湖体系。数据可能已经存放在 Lance、Iceberg、Parquet 或其他数据湖表中，治理、权限、ETL、数据血缘和合规流程也已经围绕现有数据湖建立完成。在这种情况下，企业真正需要的并不是把所有数据迁移到一个新系统里，而是：如何直接在已有数据湖上实现高效搜索和语义探索？

传统大数据系统，例如 Spark 和 Ray，主要围绕全量扫描和批处理计算设计，并不是为索引加速查询和语义检索优化的。

Zilliz Vector Lakebase 提供 fully managed storage 和 query compute，用户可以直接把数据存储并运行在 Zilliz Cloud 中。为解决上述问题，还推出了外部集合（External Collection）模式。External Collection 可以在 Zilliz 数据平面和客户已有数据湖表之间建立零拷贝逻辑映射，并在这层映射之上启用高性能索引和全谱搜索能力。

外部数据湖搜索架构：Zilliz Cloud 与 S3 存储的零拷贝映射

目前，External Collection 支持两类数据湖表格式：Lance 和 Iceberg；同时支持两类开放数据格式：Parquet 和 Vortex。对于持续更新的数据湖，Zilliz External Collection 还支持增量同步，用户可以根据数据湖更新频率和查询可见性要求，通过调用 refresh 接口灵活同步最新数据。

05 亮点四：检索升级——一个系统内完成向量、全文、JSON、地理空间和多路径检索

真实 AI 应用中的检索，早已不只是向量搜索。用户往往需要跨来源、跨模态检索和分析数据，并同时处理语义相似度、关键词匹配、JSON 元数据、地理位置、时间范围、结构化字段、多路召回结果、重排序结果等任务。

传统架构下，这通常意味着多个系统拼接：向量数据库负责语义召回，Elasticsearch 负责全文搜索，关系数据库负责结构化过滤，GIS 系统负责地理空间查询，Spark 或 Ray 负责离线分析。系统越多，数据同步越复杂，查询链路越长，结果一致性和运维成本也越难控制。

Zilliz Vector Lakebase 提供 Full‑Spectrum Search，在同一系统中支持多种数据类型和检索方式。

在数据建模上，Vector Lakebase 支持宽表建模，支持稠密向量、稀疏向量、文本、JSON、地理空间数据、基础数据类型，以及 Struct、Array 等复杂结构。用户可以在统一表结构中完成嵌套语义建模，每个 application‑level entity 可以映射为单表中的一行。

宽表建模：将文档、不同模态与结构化字段统一为一行

过去，传统做法可能会把一篇文档拆成几百行，分别存储文本块、图片和表格。而在 Zilliz Vector Lakebase 中，可以把整篇文档建模为单行，把不同模态、元数据和结构化字段统一到同一个实体中。

在数据建模之外，Vector Lakebase 还为多种数据类型提供 advanced indexing 和 search 能力，包括：

向量检索：使用先进索引算法，支持多级召回率与延迟调优，在不同性能目标下灵活平衡准确率和响应速度。
全文搜索：支持 BM25、短语查询、前缀匹配、模糊匹配和多种分词器。
Grep：内置正则能力，覆盖常见 grep 风格匹配需求。
混合检索：结合稠密向量和稀疏向量，提高召回率和相关性。
JSON 查询：通过 JSON shredding 和索引能力，对嵌套 JSON 字段进行快速过滤和查询。
地理空间搜索：支持半径查询、最近邻查询和区域过滤等地理空间能力。
多向量搜索：支持对一个或多个模态中的多个向量进行搜索，并通过统一重排序整合结果。
带过滤条件的向量搜索：支持在属性过滤条件下进行向量搜索，并针对不同过滤选择性做优化。
范围搜索：返回与查询向量距离处于指定阈值内的所有向量。
迭代式搜索：支持基于中间结果不断细化查询，适合多步骤探索场景。
多路径检索：支持在同一次查询中组合多条检索路径，每条路径都可以使用不同检索方法，并与重排序结合。

在重排序方面，Vector Lakebase 支持 Cohere、Voyage AI、Boost、Decay、RRF 和 Weighted 等多种重排序器，帮助用户在多路召回结果之间进行融合和排序，提升最终结果的相关性和业务可控性，详情如下：

六种重排序模型及其功能说明

06 亮点五：湖原生存储——统一支撑在线服务与离线分析

Zilliz Cloud 构建在存储计算完全解耦的架构之上，所有数据都持久化在云对象存储中。

存储与计算分离架构：Serving Clusters 和 On‑Demand Clusters 的数据流

和传统数据湖主要面向存储不同，Zilliz Vector Lakebase 的数据层同时面向持久化和查询执行。集合和索引与计算集群解耦，因此同一份数据和索引可以通过零拷贝方式挂载到不同集群，用于不同查询、在线服务和分析任务。

对于 AI 和 agent 应用来说，这类应用的数据模型变化很快：团队可能频繁新增标签和特征，可能切换 embedding model，可能需要对历史数据做回填，也可能要把新的 LLM 生成摘要、元数据或结构化字段加入同一张表。Zilliz 为此提供高速 schema evolution 和数据回填机制，新增字段会由平台侧共享计算资源完成回填和对齐，再通过元数据更新暴露给查询集群。1 亿行数据回填通常可以在个位数分钟内完成。此外，由于大部分工作由平台侧计算资源处理，用户现有集群不受影响，可以在整个过程中继续处理读写流量。

列式数据与索引的细粒度随机访问示意

在底层存储格式上，Zilliz 使用 Vortex 开放格式进行列式存储布局。Vortex 结合高效编码和细粒度随机访问，在随机读取场景下比 Lance 和 Parquet 更快、成本更低，同时支持按列选择不同格式，便于承载更灵活的数据模型。

针对索引，Zilliz 还提供面向对象存储优化的索引算法设计，并深度优化数据布局和访问路径，以提升 I/O 效率。这些索引包括 vector indexes、BM25 inverted indexes 和 JSON indexes。

在查询执行过程中，计算节点只会加载查询真正触达的索引页和数据实体。结合缓存和数据裁剪，可以将 read amplification 降低 90% 以上。这让 Vector Lakebase 不只是把数据放在对象存储上，而是真正让对象存储成为可服务、可检索、可分析的语义数据底座。

07 Vector Lakebase 的主要使用场景

Vector Lakebase 适合的典型场景包括：

实时服务场景

面向低延迟、高并发、生产级检索任务，例如：对延迟敏感的智能体记忆和策略检索；法律、医疗、金融等垂直行业知识库；Web 级 AI 搜索引擎；超高吞吐推荐系统；跨存储层级的秒级冷热数据动态调度；面向企业付费用户和大规模免费用户池的差异化服务层级。

交互式探索场景

面向问题定位、质量分析和多步骤探索任务，例如：基于用户反馈、智能体笔记和日志进行 AI 服务质量分析；发现知识缺口、检索失误和策略问题；高效探索大规模数据集，支持多步骤深度研究和数据分析。

批量分析场景

面向大规模离线语义计算任务，例如：超大规模语料去重和聚类；训练数据筛选；微调数据集准备；大规模过滤、检索和粗召回到精排的两阶段查询流程；为 Spark、Ray 等系统补充索引加速的语义检索能力。

数据湖融合场景

面向已有数据湖和持续演进数据模型的企业用户，例如：在 Lance、Iceberg 等数据湖表上直接启用索引和检索；在 Parquet 数据上增加语义搜索能力；支持频繁的大规模数据回填，将向量、元数据、LLM 生成摘要和结构化字段统一到以实体为中心的表中，保持统一的版本管理和数据血缘追踪。

08 现在开始体验 Zilliz Vector Lakebase

从向量数据库到 Vector Lakebase，变化的不只是产品名称。它代表的是 AI 数据基础设施的一次升级：从单一实时检索，走向在线服务、数据探索和批量分析的统一；从孤立向量索引，走向统一语义数据底座；从固定资源集群，走向湖原生存储和弹性计算；从简单 RAG 查询，走向完整 AI 数据闭环。

Zilliz Vector Lakebase Public Preview 现已开放。如果你正在构建 AI 搜索、智能体记忆、企业知识库、多模态检索、数据湖语义分析或大规模批量分析工作流，现在就可以开始体验新一代面向 AI 工作负载的语义数据平台。

尝鲜链接：https://zilliz.com.cn

以上为 Zilliz Vector Lakebase 核心能力解析，由云栈社区技术编辑整理，更多技术分享欢迎访问 yunpan.plus。

上一篇：IDEA 一站式 Claude Code 工作台 3.3k Star 开源 CC GUI 体验
下一篇：Spring Boot 3也能玩转AI？三个开源项目重塑企业级智能体落地方式

向量数据库, 数据湖, Agent, RAG, 语义搜索