云栈社区»论坛 › 技术文档「 Note & Doc 」 › SQL查询常见易错点盘点：从WHERE到窗口函数的避坑指南 ...

发回帖发新帖

5686 积分	0 好友	727 主题

发消息

SQL查询常见易错点盘点：从WHERE到窗口函数的避坑指南

发表于 2026-2-22 07:01:08 | 查看: 211| 回复: 0

SQL查询的语法看似简单，实则暗藏不少细节陷阱。从基础的WHERE与HAVING混用，到复杂的窗口函数范围定义；从空值处理的隐性逻辑，到关联查询的性能损耗，稍有不慎便可能导致结果失真、资源浪费甚至数据误操作。

这些错误往往并非源于复杂的算法设计，而是我们对SQL基础语法、数据特性和执行逻辑的理解存在偏差。无论是初学者因概念混淆写出的低效查询，还是资深工程师因疏忽犯下的“多表更新漏条件”等失误，都可能对业务系统造成影响。

下面，我们将一起梳理SQL编写中最易踩坑的七大类场景，结合实例解析错误原因并提供正确写法。

一、基本语法与概念混淆

1、混淆 `WHERE` 和 `HAVING`

易错点：WHERE 用于分组前过滤原始行，HAVING 用于分组后过滤聚合结果。
错误示例：

-- 错误：在WHERE中使用聚合函数
SELECT department_id, AVG(salary)
FROM employees
WHERE AVG(salary) > 5000  -- 此处应改用HAVING
GROUP BY department_id;

正确做法：聚合条件放 HAVING，原始字段条件放 WHERE。

-- 正确
SELECT department_id, AVG(salary)
FROM employees
WHERE hire_year > 2020  -- 原始字段条件放WHERE
GROUP BY department_id
HAVING AVG(salary) > 5000;  -- 聚合条件放HAVING

2、忘记 `GROUP BY` 的规则

易错点：SELECT 中的非聚合字段未全部包含在 GROUP BY 中。这是因为分组后，每个分组可能包含多条记录，非聚合字段在分组后的值是不确定的。
错误示例：

-- 错误：employee_name 是非聚合字段且未在GROUP BY中
SELECT department_id, employee_name, COUNT(*)
FROM employees
GROUP BY department_id;

正确做法：SELECT 中的非聚合字段必须全部在 GROUP BY 中。

-- 正确
SELECT department_id, employee_name, COUNT(*)
FROM employees
GROUP BY department_id, employee_name;  -- 包含所有非聚合字段

3、混淆 `ON` (关联条件) 和 `WHERE` (筛选条件)

易错点：在 LEFT JOIN 时将右表筛选条件放在 WHERE 子句，会导致左表数据丢失，因为 WHERE 会在连接后对所有结果进行过滤。
错误示例：

-- 错误：WHERE使LEFT JOIN变成INNER JOIN，丢失无订单的客户
SELECT c.name, o.order_date
FROM customers c
LEFT JOIN orders o ON c.id = o.customer_id
WHERE o.status = 'Shipped';

正确做法：关联条件和右表筛选条件放 ON，左表筛选条件放 WHERE。

-- 正确
SELECT c.name, o.order_date
FROM customers c
LEFT JOIN orders o ON c.id = o.customer_id
                      AND o.status = 'Shipped';  -- 右表条件放ON
WHERE c.country = 'China';  -- 左表条件放WHERE

4、误用 `SELECT *`

易错点：返回不必要列，浪费资源且易受表结构变更影响。
错误示例：

SELECT * FROM users;  -- 可能返回密码等敏感字段

正确做法：明确列出需要的列。

SELECT id, username, email FROM users;  -- 仅获取必要字段

5、`DISTINCT` 与聚合函数的混用陷阱

易错点：DISTINCT 作用于所有选中列，与聚合函数连用时易产生逻辑错误。常见的误解是认为 DISTINCT 能对分组维度去重。
错误示例：

-- 错误：想统计“不同用户的订单总金额”，但实际统计的是“所有订单中不同amount的金额总和”
SELECT SUM(DISTINCT amount) FROM orders;

正确做法：如需对聚合前的维度去重，明确使用 GROUP BY。

-- 正确：先按用户分组，再累加每个用户的订单总金额
SELECT user_id, SUM(amount)
FROM orders
GROUP BY user_id;

再看一个例子：

-- 错误：想统计“每个部门的平均工资”，但DISTINCT导致去重逻辑错误（先对工资去重再平均）
SELECT department_id, AVG(DISTINCT salary)
FROM employees
GROUP BY department_id;

-- 正确：每个部门的真实平均工资（总和/人数）
SELECT department_id, AVG(salary) AS avg_salary
FROM employees
GROUP BY department_id;

6、`ORDER BY` 引用别名的兼容性问题

易错点：部分数据库（如 MySQL）允许 ORDER BY 使用 SELECT 中的别名，而部分数据库（如 Oracle）不支持，依赖此特性易导致跨库兼容问题。
错误示例：

-- 在Oracle中可能报错：别名“total”未识别
SELECT quantity * price AS total FROM orders ORDER BY total;

正确做法：统一使用原始表达式或列名排序，以确保兼容性。

-- 兼容所有数据库
SELECT quantity * price AS total FROM orders ORDER BY quantity * price;

二、空值（NULL）处理陷阱

1、用 `=` 或 `!=` 比较 `NULL`

易错点：NULL = NULL 结果为 NULL（非真），无法用普通运算符判断。
错误示例：

-- 错误：不会返回任何结果
SELECT * FROM products WHERE category = NULL;

正确做法：使用 IS NULL 或 IS NOT NULL。

-- 正确
SELECT * FROM products WHERE category IS NULL;

2、聚合函数忽略 `NULL`

易错点：COUNT(column) 不计 NULL，AVG(column) 的分母为非 NULL 行数。
错误示例：

-- 若3条记录中1条salary为NULL，结果为(10000+8000)/2 = 9000（非6000）
SELECT AVG(salary) FROM employees;

正确做法：明确聚合函数对 NULL 的处理逻辑，必要时用 COALESCE 等函数进行转换。

-- 将NULL转为0后计算平均（需确认业务逻辑）
SELECT AVG(COALESCE(salary, 0)) FROM employees;

3、`NOT IN` 遇到子查询包含 `NULL`

易错点：子查询包含 NULL 时，NOT IN 结果恒为 UNKNOWN，导致无数据返回。
错误示例：

-- 错误：若子查询返回NULL，可能无结果
SELECT * FROM employees
WHERE department_id NOT IN (SELECT dept_id FROM departments);

正确做法：在子查询中排除 NULL，或改用 NOT EXISTS。

-- 正确：用NOT EXISTS处理NULL
SELECT * FROM employees e
WHERE NOT EXISTS (
    SELECT 1
    FROM departments d
    WHERE d.dept_id = e.department_id
);

4、`CASE WHEN` 中 `NULL` 的隐性处理

易错点：CASE WHEN 中未显式处理 NULL 时，NULL 不满足任何普通比较条件，会被默认归入 ELSE 分支，可能导致逻辑偏差。
错误示例：

-- 错误：当score为NULL时，会返回‘未知’（预期可能需单独标识）
SELECT name,
    CASE WHEN score >= 60 THEN ‘及格’
        WHEN score < 60 THEN ‘不及格’
        ELSE ‘未知’
    END AS status
FROM students;

正确做法：显式处理 NULL，避免隐性逻辑。

-- 正确：单独判断NULL，明确返回结果
SELECT name,
    CASE WHEN score IS NULL THEN ‘未考试’
        WHEN score >= 60 THEN ‘及格’
        ELSE ‘不及格’
    END AS status
FROM students;

三、关联查询（JOIN）陷阱

1、忽略 `JOIN` 条件导致笛卡尔积

易错点：未指定关联条件，返回两表行数乘积的结果，数据量可能极其庞大。
错误示例：

-- 错误：返回行数 = 客户数 × 订单数（可能达百万级）
SELECT * FROM customers, orders;

正确做法：始终指定明确的关联条件。

-- 正确
SELECT * FROM customers c JOIN orders o ON c.id = o.customer_id;

2、混淆 `INNER JOIN`, `LEFT JOIN`, `RIGHT JOIN`

易错点：用错连接类型导致数据缺失或多余。
错误示例：

-- 错误：需保留所有客户却用INNER JOIN，丢失无订单客户
SELECT c.name, o.order_id
FROM customers c INNER JOIN orders o ON c.id = o.customer_id;

正确做法：根据业务需求选择连接类型。

-- 正确：LEFT JOIN保留左表（客户）所有行
SELECT c.name, o.order_id
FROM customers c LEFT JOIN orders o ON c.id = o.customer_id;

3、多表 `JOIN` 中关联条件错误

易错点：多表连接时条件断裂或逻辑错误，导致意外产生笛卡尔积。
错误示例：

-- 错误：关联条件断裂，导致 orders 与 products 直接连接产生笛卡尔积
SELECT u.name, o.order_id, p.product_name
FROM users u
JOIN orders o ON u.id = o.user_id  -- 用户与订单正确关联
JOIN products p ON o.user_id = p.id;  -- 错误：订单与商品无直接关联（条件断裂）

正确做法：确保表之间通过链式或网状条件完整关联。

-- 正确：链式关联条件，确保表之间连接完整
SELECT u.name, o.order_id, p.product_name
FROM users u
JOIN orders o ON u.id = o.user_id  -- 正确关联用户和订单
JOIN order_items oi ON o.id = oi.order_id  -- 正确关联订单和订单项
JOIN products p ON oi.product_id = p.id;  -- 正确关联订单项和商品

四、数据类型与隐式转换问题

1、字符串比较大小写敏感/不敏感

易错点：不同数据库对字符串大小写处理不同，假设统一行为易出错。
错误示例：

-- 在区分大小写的数据库中，可能查不到‘admin’或‘ADMIN’
SELECT * FROM users WHERE username = ‘Admin’;

正确做法：统一大小写或指定排序规则。

-- 统一转为小写后比较
SELECT * FROM users WHERE LOWER(username) = ‘admin’;

2、日期/时间格式不匹配或隐式转换

易错点：对日期字段使用函数可能导致索引失效，或格式不匹配导致查询错误。
错误示例：

-- 错误：对索引列用函数，无法使用索引
SELECT * FROM orders WHERE DATE_FORMAT(order_date, ‘%Y-%m’) = ‘2025-03’;

正确做法：尽量使用范围查询替代函数，并使用标准日期格式。

-- 正确：范围查询可使用索引
SELECT * FROM orders
WHERE order_date >= ‘2025-03-01’ AND order_date < ‘2025-04-01’;

3、数字与字符串比较

易错点：字符串字段与数字比较触发隐式转换，可能导致全表扫描或结果错误。
错误示例：

-- 错误：product_code是VARCHAR，与数字比较触发隐式转换
SELECT * FROM products WHERE product_code = 12345;

正确做法：统一数据类型进行比较。

-- 正确：字符串与字符串比较
SELECT * FROM products WHERE product_code = ‘12345’;

五、性能与优化陷阱

1、在 `WHERE` 或 `JOIN` 条件中对列使用函数或表达式

易错点：对列进行函数计算或运算会导致索引失效。
错误示例：

-- 错误：对amount列计算，无法使用索引
SELECT * FROM orders WHERE amount / 100 > 10;

正确做法：将计算移到条件右侧，避免修改列值。

-- 正确：不修改列值，可使用索引
SELECT * FROM orders WHERE amount > 10 * 100;

2、过度使用嵌套子查询

易错点：多层嵌套降低性能和可读性。
错误示例：

-- 复杂嵌套，性能差
SELECT * FROM (
    SELECT * FROM (
        SELECT id FROM orders WHERE amount > 1000
    ) t1 JOIN users u ON t1.user_id = u.id
) t2;

正确做法：用 JOIN 或公用表表达式（CTE）简化查询。

-- 正确：用JOIN简化
SELECT u.* FROM users u
JOIN orders o ON u.id = o.user_id
WHERE o.amount > 1000;

3、忽略索引

易错点：未给 WHERE、JOIN、ORDER BY 中的列建立索引，或查询写法导致索引失效。
正确做法：使用 EXPLAIN 分析执行计划，指导索引创建和查询优化。

-- 查看执行计划，确认是否使用索引
EXPLAIN SELECT * FROM users WHERE username = ‘test’;

4、未限定结果集范围

易错点：查询无限制，返回海量数据耗尽资源。
错误示例：

-- 错误：日志表可能有百万行，查询缓慢
SELECT * FROM logs;

正确做法：使用 LIMIT、TOP 等关键字限制行数。

-- 正确：只返回最新100条
SELECT * FROM logs ORDER BY create_time DESC LIMIT 100;

5、`LIMIT`/`OFFSET` 分页的陷阱

易错点：OFFSET 过大时，数据库需要扫描并跳过大量无关数据，性能极差。
错误示例：

-- 错误：OFFSET 1000000 需扫描前1000010行
SELECT * FROM products ORDER BY id LIMIT 1000000, 10;

正确做法：使用基于主键或唯一键的“游标”分页，直接定位起点。

-- 正确：基于上一页最后ID，直接定位
SELECT * FROM products WHERE id > 1000000 ORDER BY id LIMIT 10;

6、`LIKE` 前模糊匹配导致索引失效

易错点：LIKE ‘%xxx’ 这种前模糊匹配无法使用索引，导致全表扫描。
错误示例：

-- 错误：前模糊匹配，索引失效
SELECT * FROM users WHERE username LIKE ‘%admin’;

正确做法：尽量避免前模糊匹配，或考虑使用全文索引等替代方案。

-- 正确：后模糊可使用索引
SELECT * FROM users WHERE username LIKE ‘admin%’;

再看一个索引失效场景：

-- 错误：对索引列使用计算函数导致索引失效
SELECT * FROM users WHERE YEAR(create_time) = 2023;
-- 正确：用范围查询替代
SELECT * FROM users WHERE create_time >= ‘2023-01-01’ AND create_time < ‘2024-01-01’;

六、其他逻辑错误

1、逻辑运算符 (`AND`, `OR`) 的优先级错误

易错点：AND 优先级高于 OR，复杂条件易出意外。
错误示例：

-- 实际执行：age > 30 OR (status = ‘active’ AND role = ‘user’)
SELECT * FROM users WHERE age > 30 OR status = ‘active’ AND role = ‘user’;

正确做法：使用括号明确逻辑运算的先后顺序。

-- 正确：明确先OR后AND
SELECT * FROM users WHERE (age > 30 OR status = ‘active’) AND role = ‘user’;

2、在子查询中无意识地引用外部表字段

易错点：非关联子查询意外引用外部字段，导致性能低下或结果错误。
正确做法：明确子查询是否关联外部表，若无需关联，应避免引用外部字段。

-- 正确：若需关联，显式关联；若无需关联，避免外部字段
SELECT * FROM users u
WHERE EXISTS (SELECT 1 FROM orders o WHERE o.user_id = u.id);  -- 显式关联

3、`UPDATE`/`DELETE` 未加 `WHERE` 条件

易错点：误操作导致全表数据被修改或删除。
错误示例：

-- 错误：无WHERE，所有用户被修改
UPDATE users SET status = ‘inactive’;

正确做法：遵循“先查后改”原则，先用 SELECT 验证条件，再执行更新/删除。

-- 正确步骤：先查询验证
SELECT * FROM users WHERE last_login < ‘2023-01-01’;
-- 再执行更新
UPDATE users SET status = ‘inactive’ WHERE last_login < ‘2023-01-01’;

4、多表 `UPDATE`/`DELETE` 的关联条件遗漏

易错点：多表关联更新/删除时，遗漏关联条件导致误修改无关表数据。
错误示例：

-- 错误：未指定关联条件，可能导致orders表所有记录被更新
UPDATE orders o, users u
SET o.status = ‘Refunded’
WHERE u.id = 1;  -- 缺少o.user_id = u.id的关联条件

正确做法：多表操作必须明确关联条件，必要时先通过 SELECT 验证关联范围。

-- 正确：明确关联条件，仅更新指定用户的订单
UPDATE orders o
JOIN users u ON o.user_id = u.id
SET o.status = ‘Refunded’
WHERE u.id = 1;

5、`UNION` 时列数或数据类型不一致

易错点：UNION 连接的多个查询的列数必须相同，且对应列的数据类型需兼容。
错误示例：

-- 错误：第一个查询返回2列，第二个查询返回1列
SELECT id, name FROM users
UNION
SELECT id FROM admins;

正确做法：确保每个查询的列数相同，数据类型兼容（必要时用 CAST 转换）。

-- 正确：调整列数，并确保数据类型兼容
SELECT id, name FROM users
UNION
SELECT id, username FROM admins;  -- 假设username与name类型兼容

6、`GROUP BY` 与 `ORDER BY` 列顺序不一致导致性能下降

易错点：GROUP BY 和 ORDER BY 的列顺序不一致时，数据库可能进行额外的排序操作。
错误示例：

-- 错误：GROUP BY顺序为department_id, job_title，但ORDER BY顺序相反
SELECT department_id, job_title, COUNT(*)
FROM employees
GROUP BY department_id, job_title
ORDER BY job_title, department_id;  -- 顺序不一致，可能触发额外排序

正确做法：尽量保持 GROUP BY 和 ORDER BY 的列顺序一致，减少排序开销。

-- 正确：顺序一致，可复用分组时的排序
SELECT department_id, job_title, COUNT(*)
FROM employees
GROUP BY department_id, job_title
ORDER BY department_id, job_title;

7、`INSERT INTO ... SELECT` 的字段数量不匹配

易错点：INSERT INTO 指定的列数与 SELECT 返回的列数不一致，导致语法错误。
错误示例：

-- 错误：目标表有3列，但SELECT只返回2列
INSERT INTO employees (id, name, department_id)
SELECT id, name FROM temp_employees;

正确做法：确保列数和顺序一致，或显式指定所有列名。

-- 正确：列数和顺序匹配
INSERT INTO employees (id, name, department_id)
SELECT id, name, dept_id FROM temp_employees;

8、`EXISTS` 与 `IN` 的选择

EXISTS 和 IN 功能相似，但执行机制不同：

IN：先执行子查询生成结果集，再进行比对。子查询结果集大时，占用内存且效率可能较低。
EXISTS：对外部表每条记录，检查子查询是否存在匹配（短路逻辑）。对子查询大小不敏感，性能更稳定，且能正确处理 NULL 值。

适用场景：

优先用 EXISTS：子查询结果集大；只需要判断“是否存在”；使用 NOT 逻辑时（NOT EXISTS 比 NOT IN 更稳定）。
可以用 IN：子查询结果集很小；使用常量列表（如 IN (1,2,3)）。

-- 错误：子查询结果集大时用IN性能差
SELECT * FROM orders WHERE customer_id IN (SELECT id FROM customers WHERE country = ‘USA’);
-- 正确：用EXISTS优化
SELECT * FROM orders o WHERE EXISTS (SELECT 1 FROM customers c WHERE c.id = o.customer_id AND c.country = ‘USA’);

七、窗口函数使用陷阱

1、混淆窗口函数与聚合函数

易错点：窗口函数（如 SUM() OVER()）不会减少行数，它会在保留明细行的同时进行计算；而聚合函数（如 SUM() 配合 GROUP BY）会合并行。
错误示例：

-- 错误：返回所有员工行，每行都有总工资（非分组聚合）
SELECT department_id, employee_name, SUM(salary) OVER() AS total_salary
FROM employees;

正确做法：分组聚合用 GROUP BY，窗口函数用于保留明细的聚合计算。

-- 正确：分组聚合
SELECT department_id, SUM(salary) AS total_salary
FROM employees
GROUP BY department_id;

2、忽略窗口函数中 `ORDER BY` 的影响

易错点：在窗口函数中使用 ORDER BY 会默认计算累积值（如累积求和），而非单纯的分组聚合。
错误示例：

-- 错误：每行返回的是截止当前行的累积工资（按hire_date排序），而非部门总工资
SELECT department_id, employee_name, salary,
    SUM(salary) OVER(PARTITION BY department_id ORDER BY hire_date) AS running_total
FROM employees;

正确做法：明确需求，若需分组总和而非累积值，应省略 ORDER BY。

-- 正确：部门总工资（无累积）
SELECT department_id, employee_name, salary,
    SUM(salary) OVER(PARTITION BY department_id) AS dept_total
FROM employees;

3、错误使用 `ROWS/RANGE` 子句

易错点：未正确理解 ROWS BETWEEN（基于物理行）与 RANGE BETWEEN（基于逻辑值范围）的区别。
错误示例：

-- 错误：默认使用RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW，若存在相同工资，这些相同工资的行会被视为同一“范围”一起计算
SELECT employee_name, salary,
    AVG(salary) OVER(ORDER BY salary) AS avg_salary
FROM employees;

正确做法：根据需求选择行模式或范围模式。ROWS 按物理行数划分，RANGE 按列值范围划分。

-- 正确：使用ROWS指定物理行，避免相同值被合并计算
SELECT employee_name, salary,
    AVG(salary) OVER(ORDER BY salary ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS avg_salary
FROM employees;

4、`WITH RECURSIVE` 递归查询的终止条件缺失

易错点：递归查询未正确设置终止条件，导致无限循环或栈溢出。
错误示例：

-- 错误：缺少终止条件，若组织关系有环，递归将无限执行
WITH RECURSIVE subordinates AS (
    SELECT id, name, manager_id FROM employees WHERE id = 1
    UNION ALL
    SELECT e.id, e.name, e.manager_id
    FROM employees e
    JOIN subordinates s ON e.manager_id = s.id  -- 无终止条件
)
SELECT * FROM subordinates;

正确做法：显式添加终止条件（如 manager_id IS NULL 或限制递归深度）。

-- 正确：当无法再找到下级时停止递归
WITH RECURSIVE subordinates AS (
    SELECT id, name, manager_id FROM employees WHERE id = 1
    UNION ALL
    SELECT e.id, e.name, e.manager_id
    FROM employees e
    JOIN subordinates s ON e.manager_id = s.id
    WHERE e.manager_id IS NOT NULL  -- 终止条件：只找还有上级的下级（从根向下找）
)
SELECT * FROM subordinates;

5、`GROUPING SETS` 与 `ROLLUP` 的结果解读错误

易错点：误认为 GROUPING SETS 会按层级聚合，实际它是生成多个独立分组的并集。
错误示例：

-- 错误：预期按部门+职位层级聚合，实际是 (部门,职位)、(部门)、(职位)、() 四个独立分组的并集
SELECT department_id, job_title, COUNT(*)
FROM employees
GROUP BY GROUPING SETS (department_id, job_title);

正确做法：根据需求选择 ROLLUP（层级聚合）或 CUBE（全维度组合）。

-- 正确：ROLLUP实现层级聚合（部门 → 部门+职位 → 总计）
SELECT department_id, job_title, COUNT(*)
FROM employees
GROUP BY ROLLUP (department_id, job_title);

总结：如何有效规避SQL错误

要避免SQL查询中的各种陷阱，可以从以下几个方面入手：

分步验证逻辑：从最简单的查询开始，逐个子句添加并检查中间结果。对于复杂逻辑，尤其是窗口函数，要特别注意结果集的行数和计算逻辑是否符合预期。
强化边界测试：针对空值（NULL）、极值、特殊字符等构建测试数据集。验证空表、全 NULL 值列等边界场景下的查询行为。
依赖执行计划分析：熟练使用 EXPLAIN 或类似命令查看查询执行计划。检查是否有全表扫描、额外的排序（filesort）或临时表操作，这些都是性能瓶颈的潜在信号。
规范语法与习惯：避免使用 SELECT *，明确列出所需字段。使用括号明确 AND/OR 的逻辑优先级。确保 UNION 等集合操作前后列的数目和数据类型匹配。
写操作三重校验：对于 UPDATE、DELETE、INSERT ... SELECT 等写操作，务必遵循“先SELECT验证，后执行操作”的原则。多表操作时，仔细检查关联条件，必要时在测试环境或事务中先行验证。
注意性能敏感操作：分页查询避免使用大 OFFSET，改用基于键值的查询。大数据量导出时，考虑使用 LIMIT 分批处理。警惕 LIKE ‘%前缀’、列上使用函数等导致索引失效的写法。

掌握这些常见易错点及其规避方法，能显著提升编写SQL语句的准确性、可靠性与效率。在实践中不断积累经验，并善用数据库提供的分析工具，是成为SQL高手的关键。如果你想深入探讨某个具体问题或查找更系统的数据库知识，也可以到云栈社区的技术文档板块与其他开发者交流。

上一篇：Go语言Benchmark性能测试原理解析：从数据结构到结果计算
下一篇：Palantir的AI商业经：用Ontology根治Agent幻觉，驱动企业利润增长

SQL, 数据库, 查询优化, 开发技巧, 避坑指南

SQL查询常见易错点盘点：从WHERE到窗口函数的避坑指南

一、基本语法与概念混淆

1、混淆 WHERE 和 HAVING

2、忘记 GROUP BY 的规则

3、混淆 ON (关联条件) 和 WHERE (筛选条件)

4、误用 SELECT *

5、DISTINCT 与聚合函数的混用陷阱

6、ORDER BY 引用别名的兼容性问题

二、空值（NULL）处理陷阱

1、用 = 或 != 比较 NULL

2、聚合函数忽略 NULL

3、NOT IN 遇到子查询包含 NULL

4、CASE WHEN 中 NULL 的隐性处理

三、关联查询（JOIN）陷阱

1、忽略 JOIN 条件导致笛卡尔积

2、混淆 INNER JOIN, LEFT JOIN, RIGHT JOIN

3、多表 JOIN 中关联条件错误