TiDB 专用系统变量和语法

TiDB 在 MySQL 的基础上,定义了一些专用的系统变量和语法用来优化性能。

系统变量

变量可以通过 SET 语句设置,例如

set @@tidb_distsql_scan_concurrency = 10;

如果需要设置全局变量,执行

set @@global.tidb_distsql_scan_concurrency = 10;

tidb_snapshot

作用域:SESSION

默认值:空字符串

这个变量用来设置当前会话期待读取的历史数据所处时刻。比如当设置为 "2017-11-11 20:20:20" 时或者一个 TSO 数字 "400036290571534337",当前会话将能读取到该时刻的数据。

tidb_import_data

作用域:SESSION

默认值:0

这个变量用来表示当前状态是否为从 dump 文件中导入数据。当这个变量被设置为 1 时,唯一索引约束不被检查以加速导入速度。这个变量不对外用,只是给 lightning 使用,请用户不要自行修改。

tidb_opt_agg_push_down

作用域:SESSION

默认值:0

这个变量用来设置优化器是否执行聚合函数下推到 Join 之前的优化操作。当查询中聚合操作执行很慢时,可以尝试设置该变量为 1。

tidb_auto_analyze_ratio

作用域:GLOBAL

默认值:0.5

这个变量用来设置自动 ANALYZE 更新的阈值。当某个表 tbl 的修改行数与总行数的比值大于 tidb_auto_analyze_ratio,并且当前时间在 tidb_auto_analyze_start_time 和 tidb_auto_analyze_end_time 之间时,TiDB 会在后台执行 ANALYZE TABLE tbl 语句以自动更新该表的统计信息。注意:只有在 TiDB 的启动配置文件中开启了 run-auto-analyze 选项,该 TiDB 才会触发 auto_analyze。

tidb_auto_analyze_start_time

作用域:GLOBAL

默认值:00:00 +0000

这个变量用来设置一天中允许自动 ANALYZE 更新的开始时间。

tidb_auto_analyze_end_time

作用域:GLOBAL

默认值:23:59 +0000

这个变量用来设置一天中允许自动 ANALYZE 更新的结束时间。

tidb_build_stats_concurrency

作用域:SESSION

默认值:4

这个变量用来设置 ANALYZE 语句执行时并发度。当这个变量被设置得更大时,会对其它的查询语句执行性能产生一定影响。

tidb_checksum_table_concurrency

作用域:SESSION

默认值:4

这个变量用来设置 ADMIN CHECKSUM TABLE 语句执行时扫描索引的并发度。当这个变量被设置得更大时,会对其它的查询语句执行性能产生一定影响。

tidb_distsql_scan_concurrency

作用域:SESSION | GLOBAL

默认值:15

这个变量用来设置 scan 操作的并发度,AP 类应用适合较大的值,TP 类应用适合较小的值。对于 AP 类应用,最大值建议不要超过所有 TiKV 节点的 CPU 核数。

tidb_current_ts

作用域:SESSION

默认值:0

这个变量是一个只读变量,用来获取当前事务的时间戳。

tidb_config

作用域:SESSION

默认值:空字符串

这个变量是一个只读变量,用来获取当前 TiDB Server 的配置信息。

tidb_index_lookup_size

作用域:SESSION | GLOBAL

默认值:20000

这个变量用来设置 index lookup 操作的 batch 大小,AP 类应用适合较大的值,TP 类应用适合较小的值。

tidb_index_lookup_concurrency

作用域:SESSION | GLOBAL

默认值:4

这个变量用来设置 index lookup 操作的并发度,AP 类应用适合较大的值,TP 类应用适合较小的值。

tidb_index_lookup_join_concurrency

作用域:SESSION | GLOBAL

默认值:4

这个变量用来设置 index lookup join 算法的并发度。

tidb_hash_join_concurrency

作用域:SESSION | GLOBAL

默认值:5

这个变量用来设置 hash join 算法的并发度。

tidb_index_serial_scan_concurrency

作用域:SESSION | GLOBAL

默认值:1

这个变量用来设置顺序 scan 操作的并发度,AP 类应用适合较大的值,TP 类应用适合较小的值。

tidb_projection_concurrency

作用域:SESSION | GLOBAL

默认值:4

这个变量用来设置 Projection 算子的并发度。

tidb_union_concurrency

  • 作用域:SESSION | GLOBAL
  • 默认值:4
  • 这个变量用于设置 union 算子的并发度。

tidb_hashagg_partial_concurrency

作用域:SESSION | GLOBAL

默认值:4

这个变量用来设置并行 hash aggregation 算法 partial 阶段的执行并发度。对于聚合函数参数不为 distinct 的情况,HashAgg 分为 partial 和 final 阶段分别并行执行。

tidb_hashagg_final_concurrency

作用域:SESSION | GLOBAL

默认值:4

这个变量用来设置并行 hash aggregation 算法 final 阶段的执行并发度。对于聚合函数参数不为 distinct 的情况,HashAgg 分为 partial 和 final 阶段分别并行执行。

tidb_index_join_batch_size

作用域:SESSION | GLOBAL

默认值:25000

这个变量用来设置 index lookup join 操作的 batch 大小,AP 类应用适合较大的值,TP 类应用适合较小的值。

tidb_skip_utf8_check

作用域:SESSION | GLOBAL

默认值:0

这个变量用来设置是否跳过 UTF-8 字符的验证。验证 UTF-8 字符需要消耗一定的性能,当可以确认输入的字符串为有效的 UTF-8 字符时,可以将其设置为 1。

tidb_init_chunk_size

作用域:SESSION | GLOBAL

默认值:32

这个变量用来设置执行过程中初始 chunk 的行数。默认值是 32。

tidb_max_chunk_size

作用域:SESSION | GLOBAL

默认值:1024

这个变量用来设置执行过程中一个 chunk 最大的行数。

tidb_mem_quota_query

作用域:SESSION

默认值:32 GB

这个变量用来设置一条查询语句的内存使用阈值。如果一条查询语句执行过程中使用的内存空间超过该阈值,会触发 TiDB 启动配置文件中 OOMAction 项所指定的行为。

tidb_general_log

作用域:SERVER

默认值:0

这个变量用来设置是否在日志里记录所有的 SQL 语句。

tidb_retry_limit

作用域:SESSION | GLOBAL

默认值:10

这个变量用来设置乐观事务的最大重试次数。一个事务执行中遇到可重试的错误(例如事务冲突、事务提交过慢或表结构变更)时,会根据该变量的设置进行重试。注意当 tidb_retry_limit = 0 时,也会禁用自动重试。该变量仅适用于乐观事务,不适用于悲观事务。

tidb_disable_txn_auto_retry

作用域:SESSION | GLOBAL

默认值:on

这个变量用来设置是否禁用显式的乐观事务自动重试,设置为 on 时,不会自动重试,如果遇到事务冲突需要在应用层重试。

如果将该变量的值设为 off,TiDB 将会自动重试事务,这样在事务提交时遇到的错误更少。需要注意的是,这样可能会导致数据更新丢失。

这个变量不会影响自动提交的隐式事务和 TiDB 内部执行的事务,它们依旧会根据 tidb_retry_limit 的值来决定最大重试次数。

是否需要禁用自动重试,请参考重试的局限性

该变量只适用于乐观事务,不适用于悲观事务。悲观事务的重试次数由 max_retry_count 控制。

tidb_backoff_weight

作用域:SESSION | GLOBAL

默认值:2

这个变量用来给 TiDB 的 backoff 最大时间增加权重,即内部遇到网络或其他组件(TiKV、PD)故障等时,发送重试请求的最大重试时间。可以通过这个变量来调整最大重试时间,最小值为 1。

例如,TiDB 向 PD 取 TSO 的基础超时时间是 15 秒,当 tidb_backoff_weight = 2 时,取 TSO 的最大超时时间为:基础时间 * 2 等于 30 秒。

在网络环境较差的情况下,适当增大该变量值可以有效缓解因为超时而向应用端报错的情况;而如果应用端希望更快地接到报错信息,则应该尽量减小该变量的值。

tidb_enable_table_partition

作用域:SESSION

默认值:"auto"

这个变量用来设置是否开启 TABLE PARTITION 特性。默认值 auto 表示开启 range partition 和 hash partion。off 表示关闭 TABLE PARTITION 的特性,此时语法还是会依旧兼容,只是建立的 partition table 实际上并不是真正的 partition table,而是和普通的 table 一样。on 表示开启,目前的作用和 auto 一样。

注意,目前 TiDB 只支持 range partition 和 hash partition。

tidb_backoff_lock_fast

作用域:SESSION | GLOBAL

默认值:100

这个变量用来设置读请求遇到锁的 backoff 时间。

tidb_ddl_reorg_worker_cnt

作用域:GLOBAL

默认值(3.0.3 之前版本):16

默认值(3.0.3 及之后版本):4

这个变量用来设置 DDL 操作 re-organize 阶段的并发度。

tidb_ddl_reorg_batch_size

作用域:GLOBAL

默认值(3.0.3 以前版本):1024

默认值(3.0.3 及以后版本):256

这个变量用来设置 DDL 操作 re-organize 阶段的 batch size。比如 Add Index 操作,需要回填索引数据,通过并发 tidb_ddl_reorg_worker_cnt 个 worker 一起回填数据,每个 worker 以 batch 为单位进行回填。如果 Add Index 时有较多 Update 操作或者 Replace 等更新操作,batch size 越大,事务冲突的概率也会越大,此时建议调小 batch size 的值,最小值是 32。在没有事务冲突的情况下,batch size 可设为较大值,最大值是 10240,这样回填数据的速度更快,但是 TiKV 的写入压力也会变大。

tidb_ddl_reorg_priority

作用域:SESSION

默认值:PRIORITY_LOW

这个变量用来设置 ADD INDEX 操作 re-organize 阶段的执行优先级,可设置为 PRIORITY_LOW/PRIORITY_NORMAL/PRIORITY_HIGH。

tidb_ddl_error_count_limit

作用域:GLOBAL

默认值:512

这个变量用来控制 DDL 操作失败重试的次数。失败重试次数超过该参数的值后,会取消出错的 DDL 操作。

tidb_max_delta_schema_count

作用域:GLOBAL

默认值:1024

这个变量用来设置缓存 schema 版本信息(对应版本修改的相关 table IDs)的个数限制,可设置的范围 100 - 16384。此变量在 2.1.18 及之后版本支持。

tidb_force_priority

作用域:SESSION

默认值:NO_PRIORITY

这个变量用于改变 TiDB server 上执行的语句的默认优先级。例如,你可以通过设置该变量来确保正在执行 OLAP 查询的用户优先级低于正在执行 OLTP 查询的用户。

可设置为 NO_PRIORITYLOW_PRIORITYDELAYEDHIGH_PRIORITY

tidb_opt_write_row_id

作用域:SESSION

默认值:0

这个变量用来设置是否允许 insert、replace 和 update 操作 _tidb_rowid 列,默认是不允许操作。该选项仅用于 TiDB 工具导数据时使用。

SHARD_ROW_ID_BITS

对于 PK 非整数或没有 PK 的表,TiDB 会使用一个隐式的自增 rowid,大量 INSERT 时会把数据集中写入单个 Region,造成写入热点。

通过设置 SHARD_ROW_ID_BITS,可以把 rowid 打散写入多个不同的 Region,缓解写入热点问题。但是设置的过大会造成 RPC 请求数放大,增加 CPU 和网络开销。

  • SHARD_ROW_ID_BITS = 4 表示 16 个分片
  • SHARD_ROW_ID_BITS = 6 表示 64 个分片
  • SHARD_ROW_ID_BITS = 0 表示默认值 1 个分片

语句示例:

  • CREATE TABLECREATE TABLE t (c int) SHARD_ROW_ID_BITS = 4;
  • ALTER TABLEALTER TABLE t SHARD_ROW_ID_BITS = 4;

tidb_slow_log_threshold

作用域:SESSION

默认值:300

输出慢日志的耗时阈值。当查询大于这个值,就会当做是一个慢查询,输出到慢查询日志。默认为 300ms。

示例:

set tidb_slow_log_threshold = 200;

tidb_query_log_max_len

作用域:SESSION

默认值:2048 (bytes)

最长的 SQL 输出长度。当语句的长度大于 query-log-max-len,将会被截断输出。

示例:

set tidb_query_log_max_len = 20;

tidb_txn_mode 从 v3.0.4 版本开始引入

作用域:SESSION(自 TiDB 3.0.4 起支持 GLOBAL)

默认值:"pessimistic"

这个变量用于设置事务模式。TiDB v3.0 支持了悲观事务,自 v3.0.8 开始,默认使用悲观事务模式

但如果从 3.0.7 及之前的版本升级到 >= 3.0.8 的版本,不会改变默认事务模型,即只有新创建的集群才会默认使用悲观事务模型

将该变量设置为 "optimistic" 或 "" 时,将会使用乐观事务模式

自 TiDB 3.0.4 起,该变量也支持 GLOBAL 作用域,用于设定全局的事务模式。当设定全局的事务模式时,仅在修改生效之后创建的 session 会受到影响。

tidb_constraint_check_in_place

作用域:SESSION | GLOBAL

默认值:0

该变量仅适用于乐观事务模型。当这个变量值设置为 0 时,唯一索引的重复值检查会被推迟到事务提交时才进行。这有助于提高性能,但对于某些应用,可能导致非预期的行为。详情见约束

  • 乐观事务模型下将 tidb_constraint_check_in_place 的值设置为 0

    create table t (i int key); insert into t values (1); begin optimistic; insert into t values (1);
    Query OK, 1 row affected
    commit; -- 事务提交时才检查
    ERROR 1062 : Duplicate entry '1' for key 'PRIMARY'
  • 乐观事务模型下将 tidb_constraint_check_in_place 的值设置为 1

    set @@tidb_constraint_check_in_place=1; begin optimistic; insert into t values (1);
    ERROR 1062 : Duplicate entry '1' for key 'PRIMARY'

悲观事务模型中,始终默认执行约束检查。

tidb_check_mb4_value_in_utf8

作用域:SERVER

默认值:1

这个变量用来设置是否开启对字符集为 UTF8 类型的数据做合法性检查,默认值 1 表示开启检查。这个默认行为和 MySQL 是兼容的。

注意,如果是旧版本升级时,可能需要关闭该选项,否则由于旧版本(v2.1.1 以及之前)没有对数据做合法性检查,所以旧版本写入非法字符串是可以写入成功的,但是新版本加入合法性检查后会报写入失败。具体可以参考升级后常见问题

tidb_opt_insubq_to_join_and_agg

作用域:SESSION | GLOBAL

默认值:1

这个用来设置是否开启优化规则:将子查询转成 join 和 aggregation。

示例:

打开这个优化规则后,会将下面子查询做如下变化:

select * from t where t.a in (select aa from t1);

将子查询转成 join 如下:

select * from t, (select aa from t1 group by aa) tmp_t where t.a = tmp_t.aa;

如果 t1 在列 aa 上有 unique 且 not null 的限制,可以直接改写为如下,不需要添加 aggregation。

select * from t, t1 where t.a=t1.a;

tidb_opt_correlation_threshold

作用域:SESSION | GLOBAL

默认值:0.9

这个变量用来设置优化器启用交叉估算 row count 方法的阈值。如果列和 handle 列之间的顺序相关性超过这个阈值,就会启用交叉估算方法。

交叉估算方法可以简单理解为,利用这个列的直方图来估算 handle 列需要扫的行数。

tidb_opt_correlation_exp_factor

作用域:SESSION | GLOBAL

默认值:1

当交叉估算方法不可用时,会采用启发式估算方法。这个变量用来控制启发式方法的行为。当值为 0 时不用启发式估算方法,大于 0 时,该变量值越大,启发式估算方法越倾向 index scan,越小越倾向 table scan。

tidb_enable_window_function

作用域:SESSION | GLOBAL

默认值:1

这个变量用来控制是否开启窗口函数的支持。默认值 1 代表开启窗口函数的功能。

由于窗口函数会使用一些保留关键字,可能导致原先可以正常执行的 SQL 语句在升级 TiDB 后无法被解析语法,此时可以将 tidb_enable_window_function 设置为 0

tidb_slow_query_file

作用域:SESSION

默认值:""

查询 INFORMATION_SCHEMA.SLOW_QUERY 只会解析配置文件中 slow-query-file 设置的慢日志文件名,默认是 "tidb-slow.log"。但如果想要解析其他的日志文件,可以通过设置 session 变量 tidb_slow_query_file 为具体的文件路径,然后查询 INFORMATION_SCHEMA.SLOW_QUERY 就会按照设置的路径去解析慢日志文件。更多详情可以参考 SLOW_QUERY 文档

tidb_enable_fast_analyze

作用域:SESSION | GLOBAL

默认值:0

这个变量用来控制是否启用统计信息快速分析功能。默认值 0 表示不开启。

快速分析功能开启后,TiDB 会随机采样约 10000 行的数据来构建统计信息。因此在数据分布不均匀或者数据量比较少的情况下,统计信息的准确度会比较低。这可能导致执行计划不优,比如选错索引。如果可以接受普通 ANALYZE 语句的执行时间,则推荐关闭快速分析功能。

tidb_expensive_query_time_threshold

作用域:SERVER

默认值:60

这个变量用来控制打印 expensive query 日志的阈值时间,单位是秒,默认值是 60 秒。expensive query 日志和慢日志的差别是,慢日志是在语句执行完后才打印,expensive query 日志可以把正在执行中的语句且执行时间超过阈值的语句及其相关信息打印出来。

tidb_wait_split_region_finish

作用域:SESSION

默认值:1

由于打散 region 的时间可能比较长,主要由 PD 调度以及 TiKV 的负载情况所决定。这个变量用来设置在执行 SPLIT REGION 语句时,是否同步等待所有 region 都打散完成后再返回结果给客户端。默认 1 代表等待打散完成后再返回结果。0 代表不等待 Region 打散完成就返回。

需要注意的是,在 region 打散期间,对正在打散 region 上的写入和读取的性能会有一定影响,对于批量写入,导数据等场景,还是建议等待 region 打散完成后再开始导数据。

tidb_wait_split_region_timeout

作用域:SESSION

默认值:300

这个变量用来设置 SPLIT REGION 语句的执行超时时间,单位是秒,默认值是 300 秒,如果超时还未完成,就返回一个超时错误。

tidb_scatter_region

作用域:GLOBAL

默认值:0

TiDB 默认会在建表时为新表分裂 Region。开启该变量后,会在建表语句执行时,同步打散刚分裂出的 Region。适用于批量建表后紧接着批量写入数据,能让刚分裂出的 Region 先在 TiKV 分散而不用等待 PD 进行调度。为了保证后续批量写入数据的稳定性,建表语句会等待打散 Region 完成后再返回建表成功,建表语句执行时间会是关闭该变量的数倍。

tidb_allow_remove_auto_inc 从 v3.0.4 版本开始引入

作用域:SESSION

默认值:0

这个变量用来控制是否允许通过 ALTER TABLE MODIFYALTER TABLE CHANGE 来移除某个列的 AUTO_INCREMENT 属性。默认为不允许。

tidb_enable_stmt_summary 从 v3.0.4 版本开始引入

作用域:SESSION | GLOBAL

默认值:0

这个变量用来控制是否开启 statement summary 功能。如果开启,SQL 的耗时等执行信息将被记录到系统表 performance_schema.events_statements_summary_by_digest 中,用于定位和排查 SQL 性能问题。