索引合并优化

来自泡泡学习笔记
BrainBs讨论 | 贡献2023年7月14日 (五) 08:40的版本 (创建页面,内容为“索引合并访问方法通过多个范围扫描检索行,并将它们的结果合并为一个结果集。此访问方法仅合并单个表的索引扫描,而不是跨多个表的扫描。合并可以生成底层扫描的并集、交集或并集的交集。 可能使用索引合并的示例查询: SELECT * FROM tbl_name WHERE key1 = 10 OR key2 = 20; SELECT * FROM tbl_name WHERE (key1 = 10 OR key2 = 20) AND non_key = 30; SELECT * FROM t1, t2…”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索

索引合并访问方法通过多个范围扫描检索行,并将它们的结果合并为一个结果集。此访问方法仅合并单个表的索引扫描,而不是跨多个表的扫描。合并可以生成底层扫描的并集、交集或并集的交集。


可能使用索引合并的示例查询:

SELECT * FROM tbl_name WHERE key1 = 10 OR key2 = 20;

SELECT * FROM tbl_name
  WHERE (key1 = 10 OR key2 = 20) AND non_key = 30;

SELECT * FROM t1, t2
  WHERE (t1.key1 IN (1,2) OR t1.key2 LIKE 'value%')
  AND t2.key1 = t1.some_col;

SELECT * FROM t1, t2
  WHERE t1.key1 = 1
  AND (t2.key1 = t1.some_col OR t2.key2 = t1.some_col2);


注意:
索引合并优化算法具有以下已知限制:

1、如果您的查询具有复杂的WHERE子句,包含深层的AND/OR嵌套,并且MySQL没有选择最佳的计划,请尝试使用以下标识变换来分布条件:

(x AND y) OR z => (x OR z) AND (y OR z)
(x OR y) AND z => (x AND z) OR (y AND z) 

2、索引合并不适用于全文索引。


在EXPLAIN输出中,索引合并方法在类型列中显示为index_merge。在这种情况下,键列包含使用的索引列表,而key_len列包含这些索引的最长键部分的列表。


索引合并访问方法有几种算法,可以在EXPLAIN输出的Extra字段中查看:

  • 使用intersect(...)
  • 使用union(...)
  • 使用sort_union(...)


以下部分详细描述了这些算法。优化器根据不同可用选项的成本估计,选择不同的索引合并算法和其他访问方法。


索引合并交集访问算法

当将WHERE子句转换为不同键的多个范围条件,并与AND组合时,此访问算法适用,并且每个条件满足以下之一:

  • 以如下形式的N个部分表达式,其中索引正好有N个部分(即,所有索引部分都被覆盖):
key_part1 = const1 AND key_part2 = const2 ... AND key_partN = constN


  • 对InnoDB表主键的任何范围条件。


示例:

SELECT * FROM innodb_table
  WHERE primary_key < 10 AND key_col1 = 20;

SELECT * FROM tbl_name
  WHERE key1_part1 = 1 AND key1_part2 = 2 AND key2 = 2;


索引合并交集算法在所有使用的索引上同时进行扫描,并生成从合并的索引扫描接收到的行序列的交集。


如果查询中使用的所有列都被使用的索引所覆盖,将不检索完整的表行(在这种情况下,EXPLAIN输出中的Extra字段包含Using index)。以下是这样一个查询的示例:

SELECT COUNT(*) FROM t1 WHERE key1 = 1 AND key2 = 1;


如果使用的索引没有覆盖查询中使用的所有列,则只有当所有使用的键的范围条件都满足时才检索完整的行。


如果合并的条件之一是对InnoDB表的主键的条件,则该条件不用于检索行,而是用于过滤使用其他条件检索的行。


索引合并并集访问算法

此算法的条件与索引合并交集算法类似。当将表的WHERE子句转换为与OR组合的不同键的多个范围条件时,每个条件满足以下之一,则适用此算法:

  • 以如下形式的N个部分表达式,其中索引正好有N个部分(即,所有索引部分都被覆盖):
key_part1 = const1 OR key_part2 = const2 ... OR key_partN = constN


  • 对InnoDB表主键的任何范围条件。
  • 适用于索引合并交集算法的条件。


示例:

SELECT * FROM t1
  WHERE key1 = 1 OR key2 = 2 OR key3 = 3;

SELECT * FROM innodb_table
  WHERE (key1 = 1 AND key2 = 2)
     OR (key3 = 'foo' AND key4 = 'bar') AND key5 = 5;


索引合并排序-并集访问算法

当WHERE子句被转换为通过OR组合的多个范围条件,但索引合并并集算法不适用时,适用此访问算法。


示例:

SELECT * FROM tbl_name
  WHERE key_col1 < 10 OR key_col2 < 20;

SELECT * FROM tbl_name
  WHERE (key_col1 > 10 OR key_col2 = 20) AND nonkey_col = 30;


排序-并集算法与并集算法的区别在于,排序-并集算法必须先获取所有行的行ID并对其进行排序,然后才能返回任何行。


影响索引合并优化

使用索引合并取决于optimizer_switch系统变量的index_merge、index_merge_intersection、index_merge_union和index_merge_sort_union标志的值。默认情况下,这些标志都是开启的。要仅启用特定算法,请将index_merge设置为关闭,并仅启用应允许的其他标志。


除了使用optimizer_switch系统变量在会话级别控制优化器使用索引合并算法外,MySQL还支持优化器提示,以在每个语句的基础上影响优化器。