Optimizer Fix Controls

随着产品迭代演进,TiDB 优化器的行为会发生变化,进而生成更加合理的执行计划。但在某些特定场景下,新的行为可能会导致非预期结果。例如:

  • 部分行为的效果和场景相关。有的行为改变,能在大多数场景下带来改进,但可能在极少数场景下导致回退。
  • 有时,行为细节的变化和其导致的结果之间的关系十分复杂。即使是对某处行为细节的改进,也可能在整体上导致执行计划回退。

因此,TiDB 提供了 Optimizer Fix Controls 功能,允许用户通过设置一系列 Fix 控制 TiDB 优化器的行为细节。本文档介绍了 Optimizer Fix Controls 及其使用方法,并列举了当前 TiDB 支持调整的所有 Fix。

tidb_opt_fix_control 介绍

从 TiDB v6.5.3 和 v7.1.0 开始,提供了 tidb_opt_fix_control 系统变量来更细粒度地控制优化器的行为。

一个 Fix 是用于调整 TiDB 优化器中一处行为的控制项。它以一个数字编号表示,该数字编号对应一个 GitHub Issue,在 Issue 中会有对技术细节的描述。例如 Fix 44262 对应 Issue 44262

tidb_opt_fix_control 支持设置多个 Fix,不同 Fix 之间使用逗号 (,) 分隔。格式形如 "<#issue1>:<value1>,<#issue2>:<value2>,...,<#issueN>:<valueN>",其中 <#issueN> 代表 Fix 编号。例如:

SET SESSION tidb_opt_fix_control = '44262:ON,44389:ON';

Optimizer Fix Controls 参考

33031 从 v8.0.0 版本开始引入

44262 从 v6.5.3 和 v7.2.0 版本开始引入

44389 从 v6.5.3 和 v7.2.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 对形如 c = 10 and (a = 'xx' or (a = 'kk' and b = 1)) 的过滤条件,是否尝试为 IndexRangeScan 更加完整地构造扫描范围,即 range

44823 从 v7.3.0 版本开始引入

  • 默认值:200
  • 可选值:[0, 2147483647]
  • 为了节省内存,对于参数个数超过此开关指定个数的查询,Plan Cache 将不会缓存。0 表示无限制。

44830 从 v6.5.7 和 v7.3.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 此开关控制是否让 Plan Cache 对在物理优化阶段形成的 PointGet 计划进行缓存。

44855 从 v6.5.4 和 v7.3.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 在某些场景下,当 IndexJoin 算子的 Probe 端包含 Selection 算子时,TiDB 会严重高估 IndexScan 的行数,导致在 IndexJoin 更好的时候选择了其它的执行计划。
  • TiDB 已经引入了缓解这类问题的改进逻辑。但是由于潜在的计划回退风险,该改进并没有被默认启用。
  • 此开关控制是否启用这个改进。

45132 从 v7.4.0 版本开始引入

  • 默认值:1000
  • 可选值:[0, 2147483647]
  • 此开关控制优化器进行启发式访问路径选择的阈值。当某个访问路径(如 Index_A)的估算行数远小于其他访问路径时(默认为 1000 倍),优化器会跳过代价比较直接选择 Index_A
  • 0 表示关闭此启发式访问路径选择策略。

52869 从 v8.1.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 如果查询有除了全表扫描以外的单索引扫描方式可以选择,优化器不会自动选择索引合并。详情请参考用 EXPLAIN 查看索引合并的 SQL 执行计划中的注意部分。
  • 打开此开关后,这个限制会被解除。解除此限制能让优化器在更多查询中自动选择索引合并,但也有可能忽略其他更好的执行计划,因此建议在解除此限制前针对实际场景进行充分测试,确保不会带来性能回退。

54337 从 v8.2.0 版本开始引入

  • 默认值:OFF
  • 可选值:ONOFF
  • 目前,TiDB 优化器在处理每个子句包含范围列表的复杂连接条件时,推导索引范围存在一定限制。此问题可以通过应用通用范围交集来解决。
  • 打开此开关后,这个限制会被解除。解除此限制能让优化器处理复杂范围交集。然而,对于子句数量较多(超过 10 个)的条件,可能会有略微增加优化时间的风险。