索引合并优化
索引合并访问方法通过多个范围扫描检索行,并将它们的结果合并为一个结果集。此访问方法仅合并单个表的索引扫描,而不是跨多个表的扫描。合并可以生成底层扫描的并集、交集或并集的交集。
可能使用索引合并的示例查询:
SELECT * FROM tbl_name WHERE key1 = 10 OR key2 = 20; SELECT * FROM tbl_name WHERE (key1 = 10 OR key2 = 20) AND non_key = 30; SELECT * FROM t1, t2 WHERE (t1.key1 IN (1,2) OR t1.key2 LIKE 'value%') AND t2.key1 = t1.some_col; SELECT * FROM t1, t2 WHERE t1.key1 = 1 AND (t2.key1 = t1.some_col OR t2.key2 = t1.some_col2);
注意: 索引合并优化算法具有以下已知限制: 1、如果您的查询具有复杂的WHERE子句,包含深层的AND/OR嵌套,并且MySQL没有选择最佳的计划,请尝试使用以下标识变换来分布条件: (x AND y) OR z => (x OR z) AND (y OR z) (x OR y) AND z => (x AND z) OR (y AND z) 2、索引合并不适用于全文索引。
在EXPLAIN输出中,索引合并方法在类型列中显示为index_merge。在这种情况下,键列包含使用的索引列表,而key_len列包含这些索引的最长键部分的列表。
索引合并访问方法有几种算法,可以在EXPLAIN输出的Extra字段中查看:
- 使用intersect(...)
- 使用union(...)
- 使用sort_union(...)
以下部分详细描述了这些算法。优化器根据不同可用选项的成本估计,选择不同的索引合并算法和其他访问方法。
索引合并交集访问算法
当将WHERE子句转换为不同键的多个范围条件,并与AND组合时,此访问算法适用,并且每个条件满足以下之一:
- 以如下形式的N个部分表达式,其中索引正好有N个部分(即,所有索引部分都被覆盖):
key_part1 = const1 AND key_part2 = const2 ... AND key_partN = constN
- 对InnoDB表主键的任何范围条件。
示例:
SELECT * FROM innodb_table WHERE primary_key < 10 AND key_col1 = 20; SELECT * FROM tbl_name WHERE key1_part1 = 1 AND key1_part2 = 2 AND key2 = 2;
索引合并交集算法在所有使用的索引上同时进行扫描,并生成从合并的索引扫描接收到的行序列的交集。
如果查询中使用的所有列都被使用的索引所覆盖,将不检索完整的表行(在这种情况下,EXPLAIN输出中的Extra字段包含Using index)。以下是这样一个查询的示例:
SELECT COUNT(*) FROM t1 WHERE key1 = 1 AND key2 = 1;
如果使用的索引没有覆盖查询中使用的所有列,则只有当所有使用的键的范围条件都满足时才检索完整的行。
如果合并的条件之一是对InnoDB表的主键的条件,则该条件不用于检索行,而是用于过滤使用其他条件检索的行。
索引合并并集访问算法
此算法的条件与索引合并交集算法类似。当将表的WHERE子句转换为与OR组合的不同键的多个范围条件时,每个条件满足以下之一,则适用此算法:
- 以如下形式的N个部分表达式,其中索引正好有N个部分(即,所有索引部分都被覆盖):
key_part1 = const1 OR key_part2 = const2 ... OR key_partN = constN
- 对InnoDB表主键的任何范围条件。
- 适用于索引合并交集算法的条件。
示例:
SELECT * FROM t1 WHERE key1 = 1 OR key2 = 2 OR key3 = 3; SELECT * FROM innodb_table WHERE (key1 = 1 AND key2 = 2) OR (key3 = 'foo' AND key4 = 'bar') AND key5 = 5;
索引合并排序-并集访问算法
当WHERE子句被转换为通过OR组合的多个范围条件,但索引合并并集算法不适用时,适用此访问算法。
示例:
SELECT * FROM tbl_name WHERE key_col1 < 10 OR key_col2 < 20; SELECT * FROM tbl_name WHERE (key_col1 > 10 OR key_col2 = 20) AND nonkey_col = 30;
排序-并集算法与并集算法的区别在于,排序-并集算法必须先获取所有行的行ID并对其进行排序,然后才能返回任何行。
影响索引合并优化
使用索引合并取决于optimizer_switch系统变量的index_merge、index_merge_intersection、index_merge_union和index_merge_sort_union标志的值。默认情况下,这些标志都是开启的。要仅启用特定算法,请将index_merge设置为关闭,并仅启用应允许的其他标志。
除了使用optimizer_switch系统变量在会话级别控制优化器使用索引合并算法外,MySQL还支持优化器提示,以在每个语句的基础上影响优化器。