WHERE子句优化：修订间差异

2023年7月14日 (五) 03:17的最新版本

本节讨论了处理WHERE子句时可以进行的优化。示例使用SELECT语句，但相同的优化也适用于DELETE和UPDATE语句中的WHERE子句。

注意
由于MySQL优化器的工作还在进行中，这里没有列出MySQL执行的所有优化。

您可能会尝试重写查询以加快算术运算的速度，但会牺牲可读性。因为MySQL会自动进行类似的优化，所以通常可以避免这个工作，将查询保留在更易理解和可维护的形式中。MySQL执行的一些优化如下：

删除不必要的括号：

   ((a AND b) AND c OR (((a AND b) AND (c AND d))))
-> (a AND b AND c) OR (a AND b AND c AND d)

常量折叠：

   (a < b AND b=c) AND a=5
-> b > 5 AND b=c AND a=5

常量条件删除：

   (b>=5 AND b=5) OR (b=6 AND 5=5) OR (b=7 AND 5=6)
-> b=5 OR b=6

在MySQL 8.0.14及更高版本中，这是在准备阶段进行而不是在优化阶段进行的，这有助于简化连接。

索引使用的常量表达式只会计算一次。

从MySQL 8.0.16开始，比较数值类型的列与常量值，如果值无效或超出范围，则会进行检查、折叠或删除：

# CREATE TABLE t (c TINYINT UNSIGNED NOT NULL);
  SELECT * FROM t WHERE c ≪ 256;
-≫ SELECT * FROM t WHERE 1;

对于没有WHERE子句的单个表的COUNT(*)查询，对于MyISAM和MEMORY表，直接从表信息中检索。当与一个表一起使用时，对于任何NOT NULL表达式也是如此。

早期检测无效的常量表达式。MySQL快速检测到某些SELECT语句是不可能的，并返回零行。

如果不使用GROUP BY或聚合函数（COUNT()、MIN()等），HAVING会与WHERE合并。

对于连接中的每个表，将构造一个简化的WHERE子句，以获得对表的快速WHERE评估，并尽早跳过行。

在查询中的其他任何表之前，首先读取所有常量表。常量表包括以下内容：

空表或只有一行的表。
用于具有WHERE子句的主键或唯一索引的表，其中所有索引部分与常量表达式进行比较，并定义为NOT NULL。

以下所有表都被用作常量表：

SELECT * FROM t WHERE primary_key=1;
SELECT * FROM t1,t2
  WHERE t1.primary_key=1 AND t2.primary_key=t1.id;

在尝试所有可能的情况下，找到连接表的最佳连接组合。如果ORDER BY和GROUP BY子句中的所有列都来自同一张表，则在连接时首选该表。

如果存在ORDER BY子句和不同的GROUP BY子句，或者ORDER BY或GROUP BY包含来自连接队列中第一个表以外的表的列，则创建一个临时表。

如果使用SQL_SMALL_RESULT修饰符，MySQL将使用内存中的临时表。

查询每个表索引，并使用最佳索引，除非优化器认为使用表扫描更有效。过去，基于最佳索引是否跨越了表的30%以上而使用扫描，但现在不再使用固定百分比来决定是使用索引还是扫描。优化器现在更复杂，根据额外的因素（如表大小、行数和I/O块大小）来估计。

在某些情况下，MySQL甚至可以在不查询数据文件的情况下从索引中读取行。如果从索引中使用的所有列都是数值型的，则只使用索引树来解析查询。

在输出每一行之前，会跳过不符合HAVING子句的行。

以下是一些非常快速的查询示例：

SELECT COUNT(*) FROM tbl_name;

SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;

SELECT MAX(key_part2) FROM tbl_name
  WHERE key_part1=constant;

SELECT ... FROM tbl_name
  ORDER BY key_part1,key_part2,... LIMIT 10;

SELECT ... FROM tbl_name
  ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;

假设索引列是数值型的情况下，MySQL仅使用索引树来解析以下查询：

SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;

SELECT COUNT(*) FROM tbl_name
  WHERE key_part1=val1 AND key_part2=val2;

SELECT MAX(key_part2) FROM tbl_name GROUP BY key_part1;

以下查询使用索引以排序的方式检索行，无需进行额外的排序操作：

SELECT ... FROM tbl_name
  ORDER BY key_part1,key_part2,... ;

SELECT ... FROM tbl_name
  ORDER BY key_part1 DESC, key_part2 DESC, ... ;

WHERE子句优化：修订间差异

2023年7月14日 (五) 03:17的最新版本

导航菜单

搜索