云栈社区»论坛 › 技术文档「 Note & Doc 」 › MySQL执行计划详解：为什么加了索引反而更慢？精准SQL性能调优指 ...

发回帖发新帖

1906 积分	0 好友	252 主题

发消息

MySQL执行计划详解：为什么加了索引反而更慢？精准SQL性能调优指南

发表于 2026-1-18 07:12:38 | 查看: 56| 回复: 0

下午三点，报警群突然出现大量告警。“用户中心接口超时，大量500错误！” 打开监控一看，链路追踪最终将问题指向了一条看似普通的查询：SELECT * FROM orders WHERE user_id = ? AND status = ‘pending’ ORDER BY create_time DESC。隐约记得，user_id和status上好像都建了索引，可它为什么突然成了性能瓶颈？凭着经验加了个复合索引，重启服务，问题似乎缓解了。但半小时后，警报再次响起。

如果你也曾经历过这种“头痛医头，脚痛医脚”的盲目优化，那么这篇文章正是为你准备的。盲目的索引叠加、模糊的优化直觉，在复杂的生产系统中迟早会碰壁。今天，我们将彻底抛弃玄学，握紧SQL执行计划这把手术刀，学会如何精准地诊断并根治SQL性能问题。

一、执行计划：SQL性能的“体检报告”

在深入之前，首先要建立核心认知：执行计划（Execution Plan）是数据库优化器为你选择的、它认为成本最低的执行路径蓝图。 你可以把它想象成一次全面的“体检报告”。当你觉得SQL“慢”时，这份报告能告诉你，是哪个操作负荷过重，瓶颈是什么。

如何获取这份报告？在MySQL中，最常用的方式是在查询前加上 EXPLAIN 或 EXPLAIN FORMAT=JSON。

-- 基础查看
EXPLAIN SELECT * FROM orders WHERE user_id = 10001 AND status = 'pending';

-- 查看更详细的JSON格式信息（MySQL 5.6+）
EXPLAIN FORMAT=JSON SELECT * FROM orders ...;

EXPLAIN 输出的每一行，都代表了执行计划中的一个步骤。而 EXPLAIN FORMAT=JSON 则提供了堪称海量的细节，包括成本估算、优化器跟踪信息等，是深度SQL性能优化的利器。

二、解构执行计划：关键字段的“望闻问切”

拿到报告，下一步是解读。我们重点分析 EXPLAIN 输出中的几个核心字段，它们是诊断的生命体征。

1. type：访问类型 —— “你的数据是怎么找的？”
这是判断查询效率的首要指标，从最优到最差大致如下：

system / const：通过主键或唯一索引一次就找到，性能最佳。
eq_ref：联表查询时，使用主键或唯一索引进行关联，对于前表的每一行，后表只返回一条记录。
ref：使用非唯一索引进行查找，可能返回多条记录。这是很常见的、高效的访问类型。
range：利用索引进行了范围扫描（如 BETWEEN, >, IN）。
index：全索引扫描。遍历了整个索引树，但只读取索引数据，比全表扫描好。
ALL：全表扫描（Table Scan）。这是我们需要警惕的“红色警报”，意味着数据库需要逐行检查所有数据，在数据量大时性能极差。

2. key & rows & filtered

key：实际使用的索引。如果为 NULL，说明未使用索引。
rows：MySQL估算的需要扫描的行数。这是一个预估值，但值越大通常意味着成本越高。
filtered：这是一个极易被忽略但至关重要的字段！ 它表示存储引擎层返回的数据，在Server层经过 WHERE 条件过滤后，剩余数据所占的百分比。filtered 值越低（例如10%），说明在索引层面过滤性越好；如果很高（如100%），且 rows 也很大，则意味着大量数据被传到Server层处理，负担沉重。

3. Extra：额外信息 —— “手术过程中的细节”
这里包含了大量优化细节，例如：

Using index：覆盖索引，性能极佳。查询所需的数据列全部包含在索引中，无需回表。
Using where：Server层在存储引擎返回行之后，又进行了过滤。如果 rows 很大，这可能是瓶颈。
Using filesort：文件排序。无法利用索引完成排序，需要在内存或磁盘上进行额外排序，非常消耗性能。
Using temporary：使用了临时表。常见于 GROUP BY、DISTINCT、UNION 等操作，也是性能杀手。

三、实战优化：从诊断到开方

理解了指标，我们进入实战。来看一个经典案例。

场景：查询最近一周待处理的、某个用户的订单，并按金额排序。

-- 表结构简化
CREATE TABLE `orders` (
  `id` bigint PRIMARY KEY,
  `user_id` bigint,
  `amount` decimal(10,2),
  `status` varchar(20),
  `create_time` datetime,
  KEY `idx_user` (`user_id`),
  KEY `idx_status` (`status`),
  KEY `idx_create_time` (`create_time`)
);

-- 问题SQL
SELECT id, user_id, amount, status 
FROM orders 
WHERE user_id = 12345
AND status = 'pending'
AND create_time >= '2024-01-01'
ORDER BY amount DESC
LIMIT 10;

让我们看看它的 EXPLAIN 结果（模拟）：

+----+-------------+--------+------------+------+---------------+------+---------+------+--------+----------+-----------------------------+
| id | select_type | table  | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra                       |
+----+-------------+--------+------------+------+---------------+------+---------+------+--------+----------+-----------------------------+
|  1 | SIMPLE      | orders | NULL       | ref  | idx_user      | idx_user | 8      | const | 500    |     3.33 | Using where; Using filesort |
+----+-------------+--------+------------+------+---------------+------+---------+------+--------+----------+-----------------------------+

诊断：

type: ref：使用了 idx_user 索引，这还不算最坏。
rows: 500：估计要扫描500行。
filtered: 3.33%（关键！）：这意味着通过 user_id=12345 索引扫描出的500行数据，在Server层用 status 和 create_time 条件过滤后，只剩下大约16行（500 * 3.33%）。效率极低！
Extra: Using where; Using filesort：需要Server层二次过滤，并且无法利用索引排序，需要昂贵的文件排序。

优化方案1：创建更高效的复合索引
优化原则：将 WHERE 条件中最具区分度（过滤性最好）的列放在索引前面，同时考虑 ORDER BY 和覆盖索引。

-- 删除旧索引，新建复合索引
DROP INDEX idx_user ON orders;
DROP INDEX idx_status ON orders;
-- 假设status和create_time过滤性更好，且需要按amount排序
CREATE INDEX idx_status_user_time ON orders(`status`, `user_id`, `create_time`);
-- 但ORDER BY是amount，上述索引仍无法避免filesort
-- 更优的索引，考虑覆盖查询和排序
CREATE INDEX idx_optimizer ON orders(`status`, `user_id`, `amount`， `create_time`); -- amount用于排序和覆盖

优化后，EXPLAIN 中的 type 可能变为 range 或 ref，filtered 大幅提高，Extra 中的 Using filesort 很可能消失，变为 Using index。

避坑指南：这里我曾踩过一个坑。在一种“状态机”表里，我为 status 字段加了索引，但优化效果微乎其微。后来发现，该字段只有“待处理”、“已完成”等不到5个枚举值，区分度（Cardinality）极低，数据库优化器认为走全表扫描比用索引更划算。所以，索引不是银弹，低区分度的列单独建索引往往是无效的。

优化方案2：改写SQL，引导优化器
有时，优化器可能“选错”了索引。你可以通过 FORCE INDEX 或改写查询来引导。

-- 使用FORCE INDEX（谨慎使用，因数据分布变化可能失效）
SELECT id, user_id, amount, status 
FROM orders FORCE INDEX(idx_optimizer)
WHERE ...;

-- 更优雅的方式：通过条件调整，让优化器更容易选择最优索引
-- 例如，如果create_time条件总是最近几天，数据量很小，可以尝试调整条件顺序或使用IN列表

优化方案3：应对文件排序（Filesort）与临时表
对于无法避免的 GROUP BY、DISTINCT 导致的 Using temporary，可以尝试：

确保 GROUP BY 的列顺序与索引顺序一致，或为 GROUP BY 和 ORDER BY 单独创建索引。
增大 sort_buffer_size 等临时内存参数，避免磁盘临时表。

四、高级视角：理解优化器的“思维”

要成为高手，需要偶尔站在优化器的角度思考。为什么有时候你建了索引它却不用？

成本模型（Cost Model）：优化器基于统计信息（如索引区分度、数据页数量）计算“全表扫描成本”和“索引扫描+回表成本”，选择成本更低的。如果统计信息过时（ANALYZE TABLE 可以更新），它就可能做出错误决策。
索引下推（ICP， Index Condition Pushdown）：MySQL 5.6+的特性，能将 WHERE 条件中索引部分的过滤，下推到存储引擎层执行，减少回表次数。观察 EXPLAIN 的 Extra 字段是否有 Using index condition。
多表关联（JOIN）：MySQL执行计划会显示多张表的关联顺序（id 相同按从上到下执行）。优化器会选择它认为最佳的驱动表（通常是小表或过滤后结果集小的表）和关联算法（Nested-Loop Join， Hash Join等）。

总结

优化第一步，永远是 EXPLAIN：不要靠猜，让数据说话。
紧盯三大核心指标：type 杜绝 ALL，rows 追求最小化，filtered 是过滤效率的放大镜。
索引设计黄金法则：优先考虑高区分度列，兼顾 WHERE、ORDER BY/GROUP BY 和覆盖查询（覆盖索引是王牌）。
警惕性能杀手：Using filesort 和 Using temporary 是重点优化对象，尝试通过索引或SQL改写消除。
理解优化器逻辑：了解成本模型、索引下推等机制，能解释现象，预判优化器行为。

延伸思考：“你提到了复合索引，那么假设有索引 (a, b, c)，WHERE a = 1 AND c = 3 能用上这个索引吗？为什么？” （答案：能用上前缀 a，但 c 无法作为索引过滤条件，因为中间缺失了 b，这涉及到最左前缀原则。）

掌握执行计划，就是掌握了SQL性能优化的命门。从今天起，让你的每一次优化，都有的放矢。如果你想深入探讨更多数据库调优案例，欢迎到 云栈社区 的数据库板块与更多开发者交流。

上一篇：C语言转义字符引发跨平台文件创建BUG：宏定义与注释的陷阱
下一篇：tldr命令使用指南：快速查询Linux/Unix命令行用法的开源工具

MySQL, SQL优化, 数据库索引, 执行计划, 性能调优