5600 积分	0 好友	731 主题

发消息

[面试题] MySQL面试必考：UNION与UNION ALL区别详解与性能调优指南

发表于 2025-12-11 06:36:26 | 查看: 272| 回复: 0

在MySQL数据库操作中，UNION和UNION ALL是用于合并多个SELECT查询结果集的常用运算符。它们功能相似，但在处理重复数据和执行性能上存在关键差异，理解这些区别对于编写高效SQL和应对技术面试都至关重要。

核心区别对比

特性	UNION	UNION ALL
重复数据处理	自动去除结果集中的所有重复行	保留所有行，包括完全重复的记录
性能	较慢（需要额外的去重排序操作）	较快（直接合并结果，无额外开销）
排序操作	隐式对结果进行排序以完成去重	不进行任何排序，保持原始顺序合并
结果集大小	小于或等于各查询结果的总和	严格等于各查询结果的总和

语法与示例演示

两者的基础语法结构一致，仅关键字不同：

-- UNION：合并并去重
SELECT column1, column2 FROM table1
UNION
SELECT column1, column2 FROM table2;

-- UNION ALL：简单合并，不去重
SELECT column1, column2 FROM table1
UNION ALL
SELECT column1, column2 FROM table2;

假设我们有两个分别记录纽约和洛杉矶员工的表：

employees_ny (纽约员工)	id	name
1	Alice	IT
2	Bob	HR
3	Carol	Finance

employees_la (洛杉矶员工)	id	name
2	Bob	HR
4	David	IT
5	Eve	Marketing

使用 UNION 查询：

SELECT name, department FROM employees_ny
UNION
SELECT name, department FROM employees_la;

结果（已去重）：	name	department
Alice	IT
Bob	HR
Carol	Finance
David	IT
Eve	Marketing

使用 UNION ALL 查询：

SELECT name, department FROM employees_ny
UNION ALL
SELECT name, department FROM employees_la;

结果（包含所有记录）：	name	department
Alice	IT
Bob	HR
Carol	Finance
Bob	HR	<- 重复记录被保留
David	IT
Eve	Marketing

性能差异深度分析

UNION 的额外性能开销主要来源于其去重机制：

创建临时表：首先会创建一个内部临时表来存放所有SELECT语句的结果。
排序去重：对这个临时表进行排序操作，以便识别和删除重复的行。
返回结果：将去重后的最终结果返回。

相比之下，UNION ALL 的优势非常明显：

直接合并：简单地将多个结果集拼接起来，无需中间处理。
无排序开销：省去了排序这一CPU和内存密集型操作。
资源消耗低：在处理大数据集时，性能优势会呈数量级扩大，是进行数据库查询优化的常用手段之一。

使用场景与选型建议

优先考虑使用 UNION ALL 的场景：

能够确定各个查询结果集之间没有重复数据。
业务逻辑要求保留所有原始记录，重复数据也有意义。
对查询性能有较高要求，尤其是在合并海量数据时。
作为UNION的替代进行性能优化，先使用UNION ALL再在应用层或通过嵌套查询去重。

应当使用 UNION 的场景：

需要数据库自动去除重复记录，确保结果唯一。
重复数据对后续业务逻辑或统计结果会产生干扰。
合并的结果集相对较小，性能差异可以接受。

面试标准回答参考

当被问到两者区别时，可以这样组织回答：

“UNION和UNION ALL都用于合并多个查询的结果。核心区别在于：UNION会自动去除最终结果中的所有重复行，而UNION ALL则会保留全部行，包括重复的。正因为UNION需要执行去重操作，通常涉及排序，所以其性能比UNION ALL要慢。在明确知道结果无重复或需要保留重复数据的情况下，应优先使用UNION ALL以获得更好的性能；只有当业务确实需要去重时，才选择UNION。这个知识点常用来考察候选人对SQL执行效率和底层原理的理解，是Java后端面试中数据库部分的考察重点。”

重要注意事项

列数与类型：所有合并的SELECT语句必须拥有相同数量的列，且对应列的数据类型必须兼容。
列名：最终结果集的列名通常以第一个SELECT语句中的列名为准。
排序：ORDER BY子句只能出现在整个语句的最后，用于对最终合并结果进行排序，而不能对单个SELECT子句排序（除非使用括号嵌套）。
```
-- 正确：对最终合并结果排序
SELECT name, salary FROM employees_ny
UNION ALL
SELECT name, salary FROM employees_la
ORDER BY salary DESC;
```

上一篇：GitHub 115k星免费中文编程书库：覆盖全栈技术，助力自学/面试/进阶
下一篇：MySQL性能优化：深入解析CHAR与VARCHAR的区别、使用场景与实战建议

MySQL, UNION, SQL, 面试题, 性能优化