云栈社区»论坛 › 技术文档「 Note & Doc 」 › 深入解析XBtree：如何通过Undo链与原位更新机制解决传统B-tree索 ...

发回帖发新帖

4205 积分	0 好友	552 主题

发消息

深入解析XBtree：如何通过Undo链与原位更新机制解决传统B-tree索引膨胀问题

发表于 2026-1-28 03:54:39 | 查看: 232| 回复: 0

在数据库的后端 & 架构设计与优化中，索引管理是核心课题之一。传统B-tree索引在PostgreSQL等数据库中应用广泛，但其更新机制导致的存储膨胀和性能波动一直是运维痛点。本文将深入对比传统B-tree与XStore存储引擎中的XBtree，从数据结构、更新机制到性能表现，详细解析XBtree如何利用Undo链和原位更新技术，为高并发OLTP场景提供更稳定、高效的解决方案。

XBtree vs 传统 B-tree 核心差异概览

特性维度	传统B-tree	Xbtree
更新机制	创建新版本，旧版本标记为dead	原位更新，旧数据写入Undo
版本管理	依赖事务ID标记和VACUUM清理	Undo链管理，自动回收
空间效率	存在空间膨胀，需要定期清理	原位更新避免膨胀，空间利用率高
性能特征	垃圾回收时性能波动可达40%+	性能稳定，无扫盘清理开销
运维复杂度	需要手动调优autovacuum参数	免维护，自动管理

数据结构设计差异

传统B-tree结构

传统B-tree使用标准的索引元组格式，依赖PostgreSQL的MVCC（多版本并发控制）机制进行版本管理。

Xbtree扩展结构

Xbtree在传统索引元组基础上扩展了事务和Undo信息，其核心数据结构如下：

typedef struct XBTreeIndexTupleData {
    FullTransactionId modified_xid; // 修改该索引项的事务ID
    UndoRecPtr urec;                // 指向Undo记录的指针
} XBTreeIndexTupleData;

同时，XBtree定义了索引项的状态管理标识：

#define LP_INDEX_DELETED 2     // 已删除状态
#define LP_INDEX_INSERTED LP_NORMAL // 已插入状态

更新机制对比

传统B-tree更新流程

插入新版本索引项
旧版本标记为dead
等待VACUUM清理dead版本
空间回收依赖后台进程

Xbtree原位更新流程

XBtree通过原位更新机制实现高效的空间管理。以删除操作为例：

// 删除操作 - 原位标记
static void _xbt_deleteonpage(Relation rel, Buffer buf, OffsetNumber offset, bool is_dead)
{
// 准备Undo记录
    urec_ptr = _xbt_prepare_undo_delete(...);

// 原位更新状态
    xbt_tuple->modified_xid = xid;
    xbt_tuple->urec = urec_ptr;
    IndexItemIdSetDeleted(item);

// 更新活跃计数
    opaque->active_count--;
}

可见性判断机制

版本选择器设计

XBtree定义了精细的版本选择器，用于决定哪个版本的数据对当前事务可见：

typedef enum {
    XBTREEVERSION_NONE,     // 无可见版本
    XBTREEVERSION_CURRENT,  // 当前版本可见
    XBTREEVERSION_OLDER,    // 需要检查更旧版本
    XBTREEVERSION_CHECK_CID // 需要检查命令ID
} XBTreeVersionSelector;

可见性检查流程

可见性检查是数据库/中间件/技术栈中并发控制的核心，XBtree的实现如下：

bool _xbt_tuple_satisfies(Page page, Snapshot snapshot, BlockNumber blk, OffsetNumber offnum)
{
// 获取索引项操作类型和事务信息
    op = xbtree_oper_from_lp(item);
    xbt_tuple = (XBTreeIndexTuple) XbtreeIndexGetTuple(itup);

// 版本选择
    selector = xbtree_tuple_version_select(op, snapshot, xbt_tuple->modified_xid);

// 根据选择器结果决定可见性
if (selector == XBTREEVERSION_OLDER)
        is_visible = xbtree_get_tuple_from_undo(xbt_tuple->urec, xbt_tuple, snapshot, cid);
elseif (selector == XBTREEVERSION_CURRENT)
        is_visible = true;
else
        is_visible = false;
}

Undo和回滚机制

Undo操作支持

XBtree支持完整的Undo回滚操作，这是实现原子性和一致性的基础：

switch (undotype) {
case UNDO_XBTREE_INSERT:
        undo_res = execute_undo_insert_xbtree(relation, buffer, undorecord, &target_buf, &target_offset);
break;
case UNDO_XBTREE_DELETE:
        undo_res = execute_undo_delete_xbtree(relation, undorecord, &target_buf, &target_offset);
break;
}

插入回滚实现

当需要回滚一个插入操作时，XBtree会执行以下流程：

static int execute_undo_insert_xbtree(Relation rel, Buffer buffer, UnpackedUndoRecord *urec,
                                         Buffer* tarBuffer, Offset* tarOffset)
{
// 从Undo记录恢复原始索引元组
    StringInfoData *index_tuple_data = GetUndoRecordRawdata(urec);
    itup = (IndexTuple) index_tuple_data->data;

// 搜索并删除对应的索引项
    itupKey = _xbt_mkscankey(rel, itup);
    (void) _xbt_search(rel, itupKey, tarBuffer, BT_WRITE, false);
    *tarOffset = _xbt_binsrch(rel, itupKey, *tarBuffer);
}

性能和运维优势

空间效率提升

XBtree通过原位更新技术，从根本上解决了传统索引因多版本并存而导致的空间膨胀问题，不再依赖周期性的垃圾回收（VACUUM）机制来释放空间。

性能稳定性

传统B-tree在VACUUM运行时，可能因密集的I/O操作导致查询性能出现显著波动（可达40%以上）。而XBtree消除了这类后台清理开销，提供了更稳定、可预测的性能表现。

运维简化

对于DBA而言，无需再针对不同的业务负载精心调优autovacuum相关参数，也免去了定期重建索引（REINDEX）以回收空间的运维负担，显著降低了数据库/中间件/技术栈的运维复杂性。

适用场景对比

传统B-tree适用场景

读多写少的负载
对空间膨胀不敏感的场景
运维资源充足的环境

Xbtree适用场景

高并发OLTP场景
写密集型应用
要求性能稳定的业务系统
运维资源有限的环境

总结：XBtree是XStore存储引擎针对现代数据库/中间件/技术栈需求的一项核心创新。它通过重新设计索引的数据结构和更新机制，在保持B-tree高效查询特性的同时，从根源上解决了传统索引的空间膨胀和性能波动问题。这种设计特别适合写入密集、对性能稳定性要求高的现代高并发OLTP应用。

为什么有HOT机制，B-tree索引还是会膨胀？

核心原因

HOT（Heap Only Tuples）机制虽然能显著减少索引膨胀，但并不能完全解决此问题，主要原因如下：

1. HOT的适用条件限制

HOT只在满足严格条件时才能生效：

不修改索引列：更新操作不能修改任何被索引引用的列。
页面空间充足：包含旧元组的堆页面必须有足够空间存放新版本元组。

其代码中的条件检查逻辑如下：

// HOT更新条件检查
if (use_hot_update)
{
/* Mark the old tuple as HOT-updated */
    HeapTupleSetHotUpdated(&oldtup);
/* And mark the new tuple as heap-only */
    HeapTupleSetHeapOnly(heaptup);
}

HOT无法触发的情况

更新索引列时：这是导致HOT失效的最常见原因。官方文档明确指出：
```
If any columns that are included by non-summarizing indexes are updated,
the HOT optimization is not applied, and the new tuple is inserted into
all indexes of the table.
```
这意味着，即使只更新了一个索引列，也会导致表上的所有索引都需要创建新条目，无论其他索引的列是否被修改。
页面空间不足时：
- 新元组必须能放入包含旧元组的同一页面。
- 如果空间不足，新元组会被放置到其他页面。
- 这种跨页面的更新会破坏HOT链，导致优化失效。
汇总索引的特殊情况：对于BRIN这类汇总索引，虽然允许HOT继续，但索引本身仍需要被更新以反映新的数据范围，这仅是一种部分优化。

在heapam.c中的实际检查逻辑体现了这一点：

if (!bms_overlap(modified_attrs, hot_attrs))
{
    use_hot_update = true;

// 检查是否需要更新汇总索引
if (bms_overlap(modified_attrs, sum_attrs))
        summarized_update = true;
}

2. 索引列更新导致膨胀

如前所述，一旦更新涉及任何索引列，HOT机制就完全不起作用。其直接后果是：

每次更新都会为所有索引创建全新的条目。
大量旧的、失效的索引条目堆积，成为“垃圾”，只能等待VACUUM清理。
索引大小持续增长，即所谓的“索引膨胀”。

3. B-tree索引删除机制的限制

PostgreSQL的B-tree索引提供了“自底向上删除”（bottom-up deletion）机制来清理部分垃圾，但它存在局限性：

触发条件限制：该机制主要在预期会发生页面分裂时才被触发。
删除效率有限：它可能无法识别和删除所有的垃圾索引元组。

依赖启发式算法：在某些特定数据分布或访问模式下，该算法可能失效。

A bottom-up index deletion pass targets suspected
garbage tuples in a single leaf page based on
qualitative distinctions involving logical
rows and versions.

4. 页面空间利用率问题

即使部分条目被删除，B-tree索引页面通常也不会被释放或合并，导致空间利用率低下：

if all but a few index keys on a page have
been deleted, the page remains allocated. Therefore, a usage
pattern in which most, but not all, keys in each range are eventually
deleted will see poor use of space.

具体膨胀场景

1. 频繁更新索引列

考虑一个具有多个索引的表：

-- 假设表有多个索引
CREATE TABLE t (id int, col1 int, col2 int, col3 int);
CREATE INDEX idx1 ON t(col1);
CREATE INDEX idx2 ON t(col2);
CREATE INDEX idx3 ON t(col3);

-- 更新col1会影响所有三个索引，即使只修改了col1
UPDATE t SET col1 = col1 + 1 WHERE id = 1;

2. 部分删除模式

当删除操作不是针对整个页面范围，而是零星删除其中大部分（非全部）键值时，页面利用率会变得极低，但页面本身仍被占用。

3. HOT链断裂

当HOT更新链因为跨页面或更新了索引列而断裂后，后续的更新将无法再利用HOT优化，重新回到为每个索引创建新条目的膨胀模式。

解决方案

1. 优化更新模式（应用层）

尽量批量更新，且优先更新非索引列。
审慎设计索引，避免在频繁更新的列上创建不必要的索引。

2. 定期维护（数据库层）

定期执行REINDEX或CREATE INDEX CONCURRENTLY来重建索引，回收空间。
调整autovacuum_vacuum_scale_factor等参数，使其更积极地清理死元组。
持续监控索引大小和膨胀情况。

3. 使用XStore/XBtree（架构层）

XStore的XBtree通过前文详细阐述的原位更新和Undo链管理机制，从根本上规避了上述所有导致膨胀的场景。它不依赖于HOT的严格条件，也不产生需要VACUUM清理的死索引条目，从而为高并发、写密集的OLTP场景提供了一个更优雅和彻底的内建解决方案。

对数据库核心算法/数据结构的持续创新，是应对现代应用挑战的关键。无论你是开发者还是DBA，深入理解这些底层机制，都能帮助你在技术选型和性能优化中做出更明智的决策。欢迎在云栈社区交流更多关于数据库内核与架构设计的实践经验。

上一篇：Microsoft Azure Maia 200 AI加速器上线，如何降低大模型推理成本？
下一篇：openEuler 24.03 LTS DHCP服务企业级配置与高可用实战指南

PostgreSQL, XBtree, B-tree, 索引优化, 高并发