云栈社区»论坛 › 技术文档「 Note & Doc 」 › SQL执行顺序的10个核心陷阱：从LEFT JOIN到分区裁剪优化 ...

发回帖发新帖

3930 积分	0 好友	540 主题

发消息

SQL执行顺序的10个核心陷阱：从LEFT JOIN到分区裁剪优化

发表于 2026-1-21 06:38:52 | 查看: 74| 回复: 0

我们编写SQL时，常有一个误解，即数据库会严格按照我们书写的顺序逐行执行：

SELECT 字段
FROM 表
WHERE 条件
GROUP BY 分组
ORDER BY 排序
LIMIT 分页

实际上，数据库引擎内部有一套严谨的逻辑执行顺序。理解这套顺序，是写出正确、高效SQL的基石。它不仅解释了为什么WHERE子句中不能使用SELECT定义的别名，也揭示了LEFT JOIN后数据“莫名消失”的根本原因。本文将通过剖析10个高频陷阱，逐步拆解SQL的执行逻辑。

陷阱一：`LEFT JOIN`后数据“莫名消失”？

问题：使用 LEFT JOIN 后，发现结果集缺失了左表的部分数据，排查后发现是 WHERE 条件中筛选了右表字段，应如何解决？

答案：将针对右表的筛选条件从 WHERE 子句移至 JOIN ... ON 条件中。这确保了在关联阶段就对右表进行筛选，从而保留左表所有未匹配的行。核心在于执行顺序：JOIN ... ON 发生在 WHERE 之前。

问题复现：这是一个经典陷阱。

-- 意图：查询所有用户及其“已支付”订单
SELECT u.name, o.order_id, o.status
FROM users u
LEFT JOIN orders o ON u.id = o.user_id
WHERE o.status = 'paid';  -- ⚠️ 问题在此！

此查询仅返回有“已支付”订单的用户，没有订单的用户全部消失。这实质上变成了 INNER JOIN 的效果。

正确解法：

SELECT u.name, o.order_id, o.status
FROM users u
LEFT JOIN orders o
  ON u.id = o.user_id
  AND o.status = 'paid';  -- 条件移至ON中

现在，所有用户都会出现，有支付订单的显示详情，没有的则对应字段为 NULL。

解析：ON 是“事前筛选”，WHERE 是“事后过滤”。

LEFT JOIN 的本意是：左表全保留，右表匹配则填充，不匹配则置为 NULL。
但 WHERE o.status = 'paid' 是在 JOIN 完成之后才执行的。
此时，那些右表为 NULL 的行，o.status 也是 NULL。NULL = 'paid' 的结果是 UNKNOWN（非真），因此整行被 WHERE 过滤掉。

问题SQL执行顺序：

FROM users u → 读取用户表。
LEFT JOIN orders o ON u.id = o.user_id → 关联订单表，无订单的用户其右表字段为 NULL。
WHERE o.status = 'paid' → 过滤掉所有 o.status 不是 'paid' 的行（包括 NULL）→ 左表数据被意外丢弃。

正解SQL执行顺序：

FROM users u。
LEFT JOIN orders o ON (u.id = o.user_id AND o.status = 'paid') → 关联时只考虑“已支付”的订单，其他订单在本次关联中视为“不存在”。
WHERE（无条件） → 保留所有用户。

建议：

若确实只需查询有支付订单的用户，应直接使用 INNER JOIN，语义更清晰。
进行多表 JOIN 时，务必审慎检查每个 WHERE 条件是否会“误伤”外连接（LEFT/RIGHT JOIN）的语义。
对于复杂查询，可使用注释明确区分“连接条件”与“全局过滤条件”。

陷阱二：`LIMIT 100000, 10` 为何如此之慢？

问题：LIMIT 100000, 10 查询耗时过长，如何进行优化？
答案：改用基于主键（或有序字段）的“游标分页”。例如 WHERE id > 100000 LIMIT 10，避免数据库读取并丢弃前10万行数据。

问题复现：深度分页性能陷阱。

-- 获取第10001页，每页10条
SELECT * FROM orders
ORDER BY id
LIMIT 100000, 10;

查询第1页很快，但第10000页可能慢到超时。

正确解法：使用游标（Cursor）分页。

-- 假设已知上一页最后一条记录的id是100000
SELECT * FROM orders
WHERE id > 100000
ORDER BY id
LIMIT 10;

此写法无论查询第几页，速度都很快。

解析：数据库不会“智能跳过”前 N 行。

LIMIT 100000, 10 的语义是：先读取100010行，然后丢弃前100000行，最后返回剩下的10行。
即使 id 字段有索引，数据库通常也需要沿着索引遍历到第100001条记录的位置。
数据量越大，性能衰减越严重。

问题SQL执行顺序（慢查询）：

使用索引或全表扫描，按照 ORDER BY 排序。
读取前100010行数据。
丢弃前100000行。
返回剩余的10行。

正解SQL执行顺序（快查询）：

利用主键索引，直接二分定位到 id > 100000 的记录位置。
从此位置开始，按序读取接下来的10行 → 完全避免了前10万行的读取与丢弃。

建议：

适用场景：APP“下一页”、无限滚动加载的消息流。
不适用场景：需要直接跳转到任意页码（如第100页）。此时可考虑缓存每页的起始ID。

若排序字段非唯一（如按时间 create_time），需使用复合游标来保证确定性：

WHERE (create_time, id) > (‘2024-10-01 12:00:00‘， 100000)
ORDER BY create_time, id
LIMIT 10;

游标分页要求游标字段单调递增且唯一（如自增主键）。若存在并发插入或使用UUID，需结合 (create_time， id) 等复合排序条件。
注意某些ORM框架默认使用 OFFSET 分页，需手动改造为游标分页模式。

陷阱三：跨库查询，`NULL` 的排序位置不一致？

问题：在 MySQL 和 PostgreSQL 中执行相同的分组排序查询，当分组字段包含 NULL 值时，NULL 所在组的排序位置不同，如何统一？
答案：使用 COALESCE（或 IFNULL）函数将 NULL 替换为一个明确的业务值（如 -1），确保跨数据库的排序逻辑一致。

问题复现：依赖数据库的默认 NULL 排序行为。

SELECT dept_id， COUNT(*)
FROM employees
GROUP BY dept_id
ORDER BY dept_id;

在 MySQL 中，NULL 组会排在最前面；而在 PostgreSQL 中，NULL 组默认排在最后面。这导致报表顺序不一致。

正确解法：统一 NULL 值处理。

SELECT
  COALESCE(dept_id， -1) AS dept_id_clean,
  COUNT(*)
FROM employees
GROUP BY COALESCE(dept_id， -1)
ORDER BY dept_id_clean;

现在，所有数据库中“无部门”的记录都会被标记为 -1，并固定在排序序列中的某个位置。

解析：不同数据库对 NULL 的排序规则有不同默认实现。

NULL 代表“未知值”，它不等于任何值（包括它自己）。
MySQL 默认将 NULL 视为最小值进行排序。
PostgreSQL 默认将 NULL 视为最大值进行排序。
这是数据库的设计差异，通常无法通过配置统一。

正解SQL执行顺序：

SELECT COALESCE(dept_id， -1) → 将 NULL 转换为 -1。
GROUP BY COALESCE(dept_id， -1) → 按转换后的值（含 -1）进行分组。
ORDER BY dept_id_clean → 按转换后的值排序 → 全程无 NULL，行为一致。

建议：

数据建模阶段，应尽量避免使用 NULL 来表示明确的业务含义（例如，用 0 或 -1 表示“无部门”）。
在ETL数据清洗层处理缺失值，而非在查询层临时处理。
若必须保留 NULL，可在 ORDER BY 中显式指定其位置（如果数据库支持）：
```
ORDER BY dept_id NULLS FIRST  -- PostgreSQL 语法
```

陷阱四：递归CTE查询部门层级，导致CPU 100%？

问题：使用递归公共表表达式（CTE）查询树形结构（如部门层级）时，CPU使用率飙升，应如何排查？
答案：检查数据中是否存在“环形引用”（例如部门A的父部门是B，部门B的父部门又是A）。解决方案是在递归过程中记录访问路径（path），并过滤掉会导致循环的路径。

问题复现：缺乏环路检测机制。

WITH RECURSIVE dept_tree AS (
  SELECT id, parent_id, name
  FROM departments
  WHERE parent_id IS NULL
  UNION ALL
  SELECT d.id, d.parent_id, d.name
  FROM departments d
  JOIN dept_tree dt ON d.parent_id = dt.id
)
SELECT * FROM dept_tree;

若 departments 表中存在环形数据，此查询将陷入无限循环，导致CPU跑满。

正确解法：增加路径记录与环路检测。

WITH RECURSIVE dept_tree AS (
  SELECT id, parent_id， name, CAST(id AS TEXT) AS path
  FROM departments
  WHERE parent_id IS NULL
  UNION ALL
  SELECT d.id, d.parent_id， d.name, dt.path || ‘,’ || d.id
  FROM departments d
  JOIN dept_tree dt ON d.parent_id = dt.id
  WHERE NOT (‘,’ || dt.path || ‘,’ LIKE ‘%，’ || d.id || ‘，%’)
)
SELECT * FROM dept_tree;

解析：递归查询不能“走回头路”。

递归CTE的工作方式类似“爬树”：从根节点（锚点部分）开始，逐层向下探索（递归部分）。
如果树中存在“环”，查询就会无限循环下去。
path 字段记录了从根节点到当前节点的完整路径。每次尝试加入新节点前，检查该节点ID是否已存在于 path 中，以此避免环路。

正解SQL执行顺序：

锚点查询：找到顶层部门（parent_id IS NULL），并初始化 path（如 ‘1’）。
递归步骤：根据当前部门 (dt) 查找其子部门 (d)，检查子部门ID是否已在 path 字符串中。若不在，则将子部门ID拼接到 path 后（如 ‘1，5，12’），并加入结果集。
重复步骤2，直到没有新的节点可以加入。
返回最终结果集。

建议：

PostgreSQL 支持 CYCLE 子句自动检测环路，语法更简洁。
生产环境中，建议为递归查询增加最大递归深度限制（如 MAXRECURSION 10），作为安全护栏。
定期检查数据质量，从应用层面避免产生环形引用数据。

陷阱五：`UPDATE ... LIMIT` 更新了错误的行？

问题：使用 UPDATE ... LIMIT 语句时，发现更新的行并非预期的那一行，如何避免？
答案：在使用 LIMIT 进行更新时，必须搭配 ORDER BY 子句（通常按主键排序），以确保更新的顺序是确定性的。

问题复现：无排序的更新导致不确定性。

-- 意图：处理最早的一条待处理订单
UPDATE orders
SET status = ‘processed’
WHERE status = ‘pending’
LIMIT 1;  -- ⚠️ 没有 ORDER BY！

每次执行此语句，数据库都可能更新任意一条满足 WHERE 条件的 pending 订单，导致重复处理或漏处理。

正确解法：按主键排序。

UPDATE orders
SET status = ‘processed’
WHERE status = ‘pending’
ORDER BY id ASC
LIMIT 1;

现在，每次都会更新 id 最小（即最早创建）的那条待处理订单。

解析：没有顺序，就没有确定性。

数据库表中数据的物理存储顺序是不确定的，即使有索引，不指定 ORDER BY 也不能保证返回顺序。
LIMIT 1 在没有 ORDER BY 时，意味着“任意返回一行”，而非“返回第一行”。
添加 ORDER BY id 后，才能确保按主键顺序处理，结果可预测。

正解SQL执行顺序：

WHERE status = ‘pending’ → 找出所有待处理订单。
ORDER BY id ASC → 按主键升序排列（确定顺序）。
LIMIT 1 → 取排序后的第一行。
UPDATE → 更新这一行。

注意：PostgreSQL 不支持 UPDATE ... LIMIT 语法，需要使用子查询实现：

UPDATE orders
SET status = ‘processed’
WHERE id IN (
  SELECT id FROM orders
  WHERE status = ‘pending’
  ORDER BY id
  LIMIT 1
);

对于高并发任务队列场景，PostgreSQL 更推荐结合 SELECT ... FOR UPDATE SKIP LOCKED 来实现高效、安全的无锁消费。

建议：

适用于任务队列、消息顺序消费等需要确定性处理的场景。
在MySQL中，若并发很高，可考虑在事务内使用 SELECT ... FOR UPDATE 锁定目标行，再更新。
避免在非唯一字段上使用 ORDER BY，这仍可能导致结果不稳定。

陷阱六：`COUNT(DISTINCT user_id)` 查询太慢？

问题：在大表上使用 COUNT(DISTINCT user_id) 计算唯一用户数时查询缓慢，如何优化？
答案：如果 user_id 字段上有索引，可以尝试用 GROUP BY 子查询来替代 DISTINCT。原理是利用索引进行分组去重，可能比通用的 DISTINCT 算法更高效。具体需通过执行计划验证。

问题复现：直接在大表上使用 DISTINCT。

SELECT COUNT(DISTINCT user_id) FROM user_logs; -- 亿级日志表，查询可能耗时数分钟

正确解法：尝试 GROUP BY 替代方案。

SELECT COUNT(*)
FROM (SELECT 1 FROM user_logs GROUP BY user_id) t;

当 user_id 有合适的索引时，此写法速度可能提升显著。

注意：此优化效果因数据库版本和场景而异。

MySQL 8.0+ 已对 COUNT(DISTINCT) 做了较多优化，在简单场景下性能可能已足够好。
PostgreSQL 的 COUNT(DISTINCT) 通常使用哈希聚合，性能也较好。
该技巧在 MySQL 5.7 及更早版本 中效果更为明显。
核心建议：务必通过 EXPLAIN 或 EXPLAIN ANALYZE 分析执行计划来验证优化是否有效。
```
-- 查看执行计划，关注是否出现 “Using temporary; Using filesort”
EXPLAIN FORMAT=JSON SELECT COUNT(DISTINCT user_id) FROM user_logs;
```
如果出现文件排序和临时表，则 GROUP BY 方案可能更优。

解析：DISTINCT 与 GROUP BY 的去重机制可能不同。

COUNT(DISTINCT col) 通常需要在内存或磁盘上对全部 col 值进行排序或构建哈希表来实现全局去重，内存消耗大。
GROUP BY col 则可能直接利用 col 上的索引进行高效分组，每组输出一行，实现去重。外层 COUNT(*) 只是计数，很快。

建议：

预计算：对于不要求实时UV的场景，可在每天凌晨离线计算好结果存入汇总表。
概率算法：对于近似计数可接受的场景，可使用 HyperLogLog 算法（如ClickHouse的 uniq()、Redis的 PFCOUNT），用极小误差换取巨大性能提升。
此优化在 user_id 重复率很低（接近唯一）时效果可能不明显。

陷阱七：`IN (子查询)` 因 `NULL` 值返回空结果？

问题：在 WHERE 子句中使用 IN 运算符配合子查询时，由于子查询结果集中包含 NULL 值，导致主查询返回空结果集，如何解决？
答案：在子查询中排除 NULL 值，或者改用 EXISTS 运算符。

问题复现：子查询结果含 NULL。

SELECT * FROM users
WHERE id IN (SELECT user_id FROM orders);

如果 orders.user_id 字段存在大量 NULL 值，甚至全部为 NULL，此查询可能会返回空结果集，即使 users 表中有数据。

正确解法：
方法1：子查询中过滤 NULL。

SELECT * FROM users
WHERE id IN (SELECT user_id FROM orders WHERE user_id IS NOT NULL);

方法2：改用 EXISTS（通常更优）。

SELECT * FROM users u
WHERE EXISTS (SELECT 1 FROM orders o WHERE o.user_id = u.id);

解析：NULL 在 IN 列表中是“毒药”。

SQL逻辑规定：value IN (a， b， NULL) 等价于 value = a OR value = b OR value = NULL。
任何与 NULL 的比较（包括 =）结果都是 UNKNOWN。
如果 value 既不等于 a 也不等于 b，整个表达式的结果就是 UNKNOWN。而 WHERE 子句只接受结果为 TRUE 的行，因此该行被过滤。
极端情况：若子查询返回的全是 NULL，则对于主查询的每一行，IN 判断结果均为 UNKNOWN，最终返回空集。

EXISTS 的优势：

只关心子查询是否至少返回一行，不关心具体的值，因此完全不受 NULL 影响。
语义更清晰，且数据库优化器通常能对 EXISTS 进行更高效的半连接（Semi-Join）优化，可能在找到第一个匹配项后即终止扫描。

建议：

在关联查询中，优先考虑使用 EXISTS 代替 IN，尤其是当子查询可能包含 NULL 时。
在设计表结构时，对用于关联的字段（如外键）加上 NOT NULL 约束。
在ETL过程中，清洗掉关联字段中的无效 NULL 值。

陷阱八：ClickHouse中 `GROUP BY` 查询太慢？

问题：在ClickHouse中对海量数据进行 GROUP BY 聚合查询时响应缓慢，如何优化？
答案：利用ClickHouse的物化视图和聚合函数状态（*State/*Merge）机制，创建预聚合表，将实时计算转换为增量更新，查询时直接读取预聚合结果。

问题复现：实时聚合海量数据。

SELECT
  event_date，
  uniq(user_id) AS uv,
  sum(clicks) AS total_clicks
FROM events
GROUP BY event_date; -- 亿级数据表，查询可能超时

正确解法：使用物化视图进行预聚合。

-- 1. 创建聚合物化视图
CREATE MATERIALIZED VIEW events_daily_mv
ENGINE = AggregatingMergeTree
ORDER BY event_date
AS SELECT
  event_date，
  uniqState(user_id) AS uv_state,
  sumState(clicks) AS clicks_state
FROM events
GROUP BY event_date;

-- 2. 查询时合并聚合状态
SELECT
  event_date，
  uniqMerge(uv_state) AS uv,
  sumMerge(clicks_state) AS total_clicks
FROM events_daily_mv
GROUP BY event_date;

解析：用空间换时间，变实时计算为增量计算。

ClickHouse虽然以快著称，但对PB级数据实时进行全量 GROUP BY 仍压力巨大。
预聚合思路：在数据写入时，就按照既定维度（如event_date）完成聚合计算，并将中间状态保存下来。
查询时：不再扫描原始巨表，而是直接读取预聚合的中间状态并进行最终合并，实现毫秒级响应。

注意：

ClickHouse的物化视图是异步更新的，仅对新写入的数据生效，存在秒级到分钟级的延迟。适用于对实时性要求不极致的场景。
物化视图不会自动响应原始表的历史数据变更（如 DELETE/UPDATE）。如需处理数据更新，应考虑使用 CollapsingMergeTree 或 VersionedCollapsingMergeTree 表引擎。

建议：

适用于固定维度的报表查询（如按天、地区、产品类别聚合）。
对于简单的求和场景，也可直接使用 SummingMergeTree 表引擎，更为轻量。
需权衡存储成本与查询性能，选择合适的预聚合粒度。

陷阱九：`SELECT` 中定义的别名不能在 `WHERE` 中使用？

问题：为什么在 SELECT 子句中通过 CASE WHEN 定义的别名，不能在同一查询层的 WHERE 子句中直接使用？
答案：这是由于SQL的逻辑执行顺序决定的。WHERE 在 SELECT 之前执行，执行 WHERE 时 SELECT 中的别名尚未被计算和定义。解决方案是使用子查询或公共表表达式（CTE）。

问题复现：在 WHERE 中引用 SELECT 别名。

SELECT
  id,
  CASE WHEN age >= 18 THEN ‘adult’ ELSE ‘minor’ END AS user_type
FROM users
WHERE user_type = ‘adult’;  -- 报错：Unknown column ‘user_type‘

正确解法：使用子查询或CTE。

-- 使用CTE
WITH user_types AS (
  SELECT
    id,
    CASE WHEN age >= 18 THEN ‘adult’ ELSE ‘minor’ END AS user_type
  FROM users
)
SELECT * FROM user_types
WHERE user_type = ‘adult’;

解析：SQL语句的逻辑执行顺序是关键。
标准顺序为：FROM -> WHERE -> GROUP BY -> HAVING -> SELECT -> ORDER BY -> LIMIT

WHERE 子句在 SELECT 子句之前执行。当数据库引擎处理 WHERE 时，SELECT 中定义的 user_type 别名根本还不存在，因此报错。
ORDER BY 在 SELECT 之后执行，因此可以安全地使用 SELECT 中的别名。
GROUP BY 和 HAVING 在 SELECT 之前执行，标准SQL不允许在其中使用 SELECT 别名。

特殊情况：

MySQL 做了一些语法扩展，允许在 GROUP BY 中使用 SELECT 别名。但这只是解析阶段的语法糖，并未改变逻辑执行顺序，且会导致SQL语句跨数据库兼容性变差，不推荐依赖此特性。
少数现代数据仓库（如BigQuery）也支持在 WHERE 中使用 SELECT 别名，同样是语法糖。为保证SQL的可移植性，建议遵循标准写法。

建议：

遵循标准SQL规范，避免在 WHERE， GROUP BY， HAVING 中引用 SELECT 别名。
对于复杂的列计算和筛选，使用CTE可以大幅提升SQL的可读性和可维护性。
避免在 WHERE 子句中冗余地重复 SELECT 中的复杂表达式。

陷阱十：TiDB分区表查询未触发分区裁剪？

问题：TiDB中按时间范围分区的表，查询时执行计划显示仍然扫描了所有分区，未能实现分区裁剪，如何解决？
答案：确保查询的 WHERE 条件中直接包含了分区键字段的范围比较，或者使用 PARTITION 语法显式指定要查询的分区。避免在分区键上使用函数，除非该函数是TiDB优化器支持的单调函数。

问题复现：查询条件未使用分区键。

-- 假设 sales 表按 `dt` 字段进行RANGE分区
SELECT * FROM sales
WHERE create_time >= ‘2024-01-01’;  -- ⚠️ 条件字段是 create_time， 而非分区键 dt

此查询会扫描 sales 表的所有分区，性能低下。

正确解法：在条件中使用分区键。

-- 方案1：使用分区键字段进行过滤
SELECT * FROM sales
WHERE dt BETWEEN ‘2024-01-01’ AND ‘2024-01-31’;

-- 方案2：显式指定查询分区
SELECT * FROM sales PARTITION (p202401);

解析：优化器需要明确的“线索”来定位数据所在分区。

分区裁剪是优化器根据 WHERE 条件，排除那些肯定不包含所需数据的分区，仅扫描相关分区的过程。
如果 WHERE 条件中的字段不是分区键，优化器无法推断数据位于哪个或哪些分区，出于安全考虑，只能选择扫描全部分区。

注意与建议：

TiDB从 v6.0 开始增强了对分区裁剪的支持，支持在部分单调函数（如 TO_DAYS(dt)， UNIX_TIMESTAMP(dt)）上实现裁剪。但像 YEAR(dt)， MONTH(dt) 这类非单调或值域变换函数，通常仍会导致全表扫描。
最稳妥的做法是直接在 WHERE 条件中使用分区键的原生字段进行范围比较。
可通过 EXPLAIN 语句查看是否触发了分区裁剪。如果结果中显示 partition:all，说明未裁剪；如果显示如 partition:p202401，则裁剪成功。
设计原则：选择最频繁被查询的字段作为分区键（如日期、地域编号）。
定期执行 ANALYZE TABLE 更新表统计信息，帮助优化器做出更准确的分区裁剪决策。

理解并掌握SQL背后的逻辑执行顺序，能帮助我们从根本上规避上述陷阱，写出既正确又高效的查询语句。从 JOIN 到 GROUP BY，从 LIMIT 分页到递归查询，每个环节都蕴含着数据库优化的智慧。如果你想深入探讨更多数据库相关的实战技巧和架构设计，欢迎持续关注技术社区的分享。

上一篇：Linux网络连接排查指南：深入解析ss与netstat命令实战技巧
下一篇：Coze 2.0体验：用FFmpeg和ImageMagick实战低门槛Skill构建与长期计划

SQL, 数据库优化, MySQL, PostgreSQL, 分区表

SQL执行顺序的10个核心陷阱：从LEFT JOIN到分区裁剪优化

陷阱一：LEFT JOIN后数据“莫名消失”？

陷阱二：LIMIT 100000, 10 为何如此之慢？

陷阱三：跨库查询，NULL 的排序位置不一致？

陷阱四：递归CTE查询部门层级，导致CPU 100%？

陷阱五：UPDATE ... LIMIT 更新了错误的行？

陷阱六：COUNT(DISTINCT user_id) 查询太慢？

陷阱七：IN (子查询) 因 NULL 值返回空结果？

陷阱八：ClickHouse中 GROUP BY 查询太慢？

陷阱九：SELECT 中定义的别名不能在 WHERE 中使用？

陷阱十：TiDB分区表查询未触发分区裁剪？

相关帖子

陷阱一：`LEFT JOIN`后数据“莫名消失”？

陷阱二：`LIMIT 100000, 10` 为何如此之慢？

陷阱三：跨库查询，`NULL` 的排序位置不一致？

陷阱五：`UPDATE ... LIMIT` 更新了错误的行？

陷阱六：`COUNT(DISTINCT user_id)` 查询太慢？

陷阱七：`IN (子查询)` 因 `NULL` 值返回空结果？

陷阱八：ClickHouse中 `GROUP BY` 查询太慢？

陷阱九：`SELECT` 中定义的别名不能在 `WHERE` 中使用？