TiDB 7.3.0 Release Notes

发版日期:2023 年 8 月 14 日

TiDB 版本:7.3.0

试用链接:快速体验 | 下载离线包

v7.3.0 引入了以下主要功能。功能详情中列出的部分功能旨在增强 TiDB 和 TiFlash 的查询稳定性,不直接面向用户,因此未包含在下表中。

分类功能描述
可扩展性与性能TiDB Lightning 支持 Partitioned Raft KV(实验特性)TiDB Lightning 的数据导入服务支持新的 Partitioned Raft KV 架构,为 Partitioned Raft KV 在 TiDB 后续版本中 GA 做好准备。
稳定性与高可用TiDB Lightning 引入冲突数据的自动检测和处理机制TiDB Lightning 物理导入模式支持新版本的冲突检测机制,支持在遇到数据冲突时替换 (replace) 或忽略 (ignore) 冲突数据的语义。TiDB Lightning 会自动处理冲突数据,同时提高了冲突处理的性能。
手动标记资源使用超出预期的查询(实验特性)查询耗费的时间有时会超出预期。通过资源组新增的 Runaway Queries 监控列表,你可以设置降低 Runaway Queries 的优先级或终止查询,从而更有效地管理查询。该功能允许算子在资源组级别通过匹配 SQL 文本、SQL digest 或执行计划标记查询,并对这些查询进行处理,从而更好地控制非预期的大型查询可能对集群产生的影响。
SQL添加更多优化器提示,加强对算子的控制,提升查询稳定性新增优化器提示:NO_INDEX_JOIN()NO_MERGE_JOIN()NO_INDEX_MERGE_JOIN()NO_HASH_JOIN()NO_INDEX_HASH_JOIN()
数据库管理与可观测性显示统计信息收集的进度支持使用 SHOW ANALYZE STATUS 语句或通过 mysql.analyze_jobs 系统表查看 ANALYZE 任务的进度。

功能详情

性能

  • TiFlash 支持副本选择策略 #44106 @XuHuaiyu

    在 v7.3.0 之前,当 TiFlash 进行数据扫描和 MPP 计算时,会尽可能使用其所有节点的副本,以提供最强大的性能。从 v7.3.0 起,TiFlash 引入副本选择策略,该策略由系统变量 tiflash_replica_read 控制,可以根据节点的区域属性选择特定的副本,调度部分节点进行数据扫描及 MPP 计算。

    当集群部署在多个机房且每个机房都拥有完整的 TiFlash 数据副本时,你可以设置该策略只选择使用当前机房的 TiFlash 副本,即只在当前机房的 TiFlash 节点中进行数据扫描和 MPP 计算,从而避免大量跨机房的网络数据传输。

    更多信息,请参考用户文档

  • TiFlash 支持节点内的 Runtime Filter #40220 @elsa0520

    Runtime Filter 是在查询规划阶段生成的一种动态取值谓词。在表连接的过程中,这些动态谓词能够有效过滤掉不满足连接条件的行,减少扫描时间和网络开销,提升表连接的效率。自 v7.3.0 起,TiFlash 支持节点内的 Runtime Filter,提升了数据分析类查询的整体性能,在部分 TPC-DS 数据集的查询中可达到 10% ~ 50% 的性能提升。

    该功能在 v7.3.0 默认关闭。要启用此功能,需将变量 tidb_runtime_filter_mode 设置为 LOCAL

    更多信息,请参考用户文档

  • TiFlash 支持执行公共表表达式 (CTE)(实验特性)#43333 @winoros

    在 v7.3.0 版本之前,TiFlash 的 MPP 引擎默认无法执行包含 CTE 的查询,你需要通过系统变量 tidb_opt_force_inline_cte 强制 inline CTE,达到让查询尽可能在 MPP 框架下执行的效果。在 v7.3.0 中,TiFlash MPP 引擎支持执行包含 CTE 的查询,无需强制 inline CTE 也可以尽可能地在 MPP 框架中执行查询。在 TPC-DS 基准测试中,与强制 inline 的执行方式相比,该功能可以将包含 CTE 的查询的总执行速度提升 20%。

    该功能为实验特性,默认关闭,由变量 tidb_opt_enable_mpp_shared_cte_execution 控制。

稳定性

  • 新增部分优化器提示 #45520 @qw4990

    TiDB 在 v7.3.0 新增了几个优化器提示,用来控制表之间的连接方式,包括:

    更多信息,请参考用户文档

  • 手动标记资源使用超出预期的查询(实验特性)#43691 @Connor1996 @CabinfeverB

    在 v7.2.0 中,TiDB 自动管理资源使用超出预期的查询 (Runaway Query),即自动降级或取消运行时间超出预期的查询。在实际运行时,只依靠规则无法覆盖所有情况。因此,TiDB v7.3.0 新增手动标记查询的功能。利用新增的命令 QUERY WATCH,你可以根据 SQL 的文本、SQL Digest 或执行计划标记查询,命中的查询可以被降级或取消。

    手动标记 Runaway Query 的功能为数据库中突发的性能问题提供了有效的干预手段。针对由查询引发的性能问题,在定位根本原因之前,该功能可以快速缓解其对整体性能的影响,从而提升系统服务质量。

    更多信息,请参考用户文档

SQL 功能

  • List 和 List COLUMNS 分区表支持默认分区 #20679 @mjonss @bb7133

    在 v7.3.0 以前,当使用 INSERT 语句向 List 或 List COLUMNS 分区表插入数据时,这些数据需要满足分区表指定的分区条件。如果要插入的数据不匹配任何分区条件,该语句将执行失败或忽略不符合分区条件的数据。

    在 v7.3.0 中,List 和 List COLUMNS 分区表支持默认分区功能。在创建默认分区后,如果要插入的数据不匹配任何分区条件,则数据将被写入默认分区。默认分区功能可以提升 List 分区和 List COLUMNS 分区的使用便捷性,避免不符合分区条件的数据导致 INSERT 语句执行失败或者数据被忽略。

    需要注意的是,该功能是 TiDB 对 MySQL 语法的扩展。创建默认分区后,该分区表的数据无法直接同步到 MySQL 中。

    更多信息,请参考用户文档

可观测性

  • 显示统计信息收集的进度 #44033 @hawkingrei

    收集大表的统计信息经常会持续较长时间。在之前的版本中,无法了解统计信息收集的进度,进而无法预测完成时间。TiDB v7.3.0 新增显示统计信息收集进度的功能。你可以通过系统表 mysql.analyze_jobs 或者 SHOW ANALYZE STATUS 查看各个子任务的总体工作量、当前进度以及预计的完成时间。在大规模数据导入、SQL 性能优化等场景下,该功能有助于了解整体任务进度,提升用户体验。

    更多信息,请参考用户文档

  • Plan Replayer 支持导出历史统计信息 #45038 @time-and-fate

    自 v7.3.0 起,通过新增的 dump with stats as of timestamp 子句,你可以使用 Plan Replayer 导出指定 SQL 相关对象在指定时间点的统计信息。在执行计划问题的诊断过程中,通过对历史统计信息的准确抓取,能够更精确地分析出执行计划在问题发生的时间点是如何生成的,从而找到问题的根本原因,大大提升执行计划问题的诊断效率。

    更多信息,请参考用户文档

数据迁移

  • TiDB Lightning 引入新版冲突数据检测和处理机制 #41629 @lance6716

    在之前的版本中,TiDB Lightning 的逻辑导入模式和物理导入模式各自使用独立的冲突检测和处理方式,其配置较为复杂且不易理解。另外,在物理导入模式下,无法通过替换 (replace) 或忽略 (ignore) 策略处理冲突的数据。从 v7.3.0 开始,TiDB Lightning 引入新版冲突检测和处理机制,逻辑导入模式和物理导入模式都使用相同的冲突检测和处理方式,即可以选择在遇到冲突数据时报错 (error)、替换 (replace) 或忽略 (ignore)。同时还支持设置冲突记录的上限,例如在处理指定数量冲突记录后任务中断退出,也可以记录哪些数据发生了冲突,以便后续排查。

    当导入数据存在大量冲突时,推荐使用新版冲突检测和处理机制,以获得更好的性能。在实验环境下,相比旧版,新版机制最高可将冲突检测和处理的性能提升 3 倍。该性能数据仅供参考,实际性能会受到环境配置、表结构、冲突数据的占比等因素影响。注意新版和旧版冲突处理机制不能同时使用。未来将废弃旧版冲突检测和处理机制。

    更多信息,请参考用户文档

  • TiDB Lightning 支持 Partitioned Raft KV(实验特性)#14916 @GMHDBJD

    TiDB Lightning 支持 Partitioned Raft KV,该功能可以提升 TiDB Lightning 导入数据的性能。

  • TiDB Lightning 引入新的参数 enable-diagnose-log 用于打印更多的诊断日志,方便定位问题 #45497 @D3Hunter

    默认情况下,该功能未启用,即只打印包含 lightning/main 的日志。开启该功能后,将打印所有包(包括 client-gotidb)的日志,以帮助诊断与 client-gotidb 相关的问题。

    更多信息,请参考用户文档

兼容性变更

行为变更

  • Backup & Restore (BR)

    • 全量恢复前增加了空集群检查,默认不支持恢复到非空集群。如果强制恢复,可以使用 --filter 指定对应表名。
  • TiDB Lightning

    • 废弃 tikv-importer.on-duplicate,由 conflict.strategy 替代。
    • TiDB Lightning 停止迁移任务之前能容忍的最大非严重 (non-fatal errors) 错误数的配置项 max-error 不再包含导入数据冲突记录的上限,由 conflict.threshold 控制可容忍的最大冲突的记录数。
  • TiCDC

    • 当 Kafka sink 使用 Avro 协议时,如果开启了 force-replicate 参数,创建 changefeed 会报错。
    • 由于 delete-only-output-handle-key-columnsforce-replicate 参数不兼容,同时开启两个参数时,创建 changefeed 会报错。
    • 当使用 Open Protocol 作为输出协议时,UPDATE 类型的事件将仅输出变更的列。

系统变量

变量名修改类型描述
tidb_opt_enable_mpp_shared_cte_execution修改该变量从 v7.3.0 开始生效,用于控制非递归的公共表表达式 (CTE) 是否可以在 TiFlash MPP 执行。
tidb_allow_tiflash_cop新增用于在 TiDB 给 TiFlash 下推计算任务时选择生成执行计划的协议。
tidb_lock_unchanged_keys新增用于控制部分场景下,对于事务中涉及但并未修改值的 key 是否进行上锁。
tidb_opt_enable_non_eval_scalar_subquery新增这个变量用于控制 EXPLAIN 语句是否禁止提前执行可以在优化阶段展开的常量子查询。
tidb_skip_missing_partition_stats新增这个变量用于控制当分区统计信息缺失时生成 GlobalStats 的行为。
tiflash_replica_read新增这个变量用于设置当查询需要使用 TiFlash 引擎时,TiFlash 副本的选择策略。

配置文件参数

配置文件配置项修改类型描述
TiDBenable-32bits-connection-id新增这个变量用于控制是否开启生成 32 位 connection ID 的功能。
TiDBin-mem-slow-query-recent-num新增这个变量用于控制缓存在内存中的最近使用的 slow query 个数。
TiDBin-mem-slow-query-topn-num新增这个变量用于控制缓存在内存中的最慢的 slow query 个数。
TiKVcoprocessor.region-bucket-size修改为降低客户端超时的可能性,默认值从 96MiB 修改为 50MiB
TiKVraft-engine.format-version修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,会引入 Ribbon filter,因此将默认值从 2 修改为 5
TiKVraftdb.max-total-wal-size修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,TiKV 会跳过写 WAL,因此默认值从 "4GB" 修改为 1,即禁用 WAL。
TiKVrocksdb.[defaultcf|writecf|lockcf].compaction-guard-min-output-file-size修改为解决大数据写入情况下 compaction 速度跟不上写入速度的问题,默认值从 "1MB" 修改为 "8MB"
TiKVrocksdb.[defaultcf|writecf|lockcf].format-version修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,会引入 Ribbon filter,因此将默认值从 2 修改为 5
TiKVrocksdb.lockcf.write-buffer-size修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,为加快 lockcf 上 compaction 的速度,默认值从 "32MB" 修改为 "4MB"
TiKVrocksdb.max-total-wal-size修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,TiKV 会跳过写 WAL,因此默认值从 "4GB" 修改为 1,即禁用 WAL。
TiKVrocksdb.stats-dump-period修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,为关闭冗余日志的打印,默认值从 "10m" 修改为 "0"
TiKVrocksdb.write-buffer-limit修改为减小 memtable 的内存开销,当 storage.engine="raft-kv" 时,默认值从本机内存的 25% 修改为 0,即不限制。当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,默认值从本机内存的 25% 修改为本机内存的 20%。
TiKVstorage.block-cache.capacity修改当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,为弥补 memtable 的内存开销,将默认值从系统总内存大小的 45% 修改为系统总内存大小的 30%。
TiFlashstorage.format_version修改引入新的 DTFile 储存文件格式 format_version = 5,该格式可以合并小文件从而减少物理文件数量。注意该格式目前为实验特性,默认未启用。
TiDB Lightningtikv-importer.incremental-import删除TiDB Lightning 并行导入参数。因为该参数名容易被误认为是增量导入的参数,因此更名为 tikv-importer.parallel-import。如果用户传入旧的参数名,会被自动转成新的参数名。
TiDB Lightningtikv-importer.on-duplicate废弃TiDB Lightning 逻辑导入模式插入冲突数据时执行的操作。从 v7.3.0 起,该参数由 conflict.strategy 取代。
TiDB Lightningconflict.max-record-rows新增TiDB Lightning 新版冲突检测与处理策略,用于记录在数据导入过程中遇到的冲突记录,并允许设置最大上限,默认值为 100
TiDB Lightningconflict.strategy新增TiDB Lightning 新版冲突检测与处理的策略,包含 ""(不做冲突检测),"error"(遇到冲突数据即报错并停止导入),"replace"(遇到冲突记录替换已有的冲突记录),"ignore"(遇到冲突记录忽略需要插入的该条冲突记录)四种策略。默认值为 "",即不做冲突检测。
TiDB Lightningconflict.threshold新增TiDB Lightning 新版冲突检测与处理策略允许的冲突上限,conflict.strategy="error" 时默认值为 0,当 conflict.strategy="replace"conflict.strategy="ignore" 时默认值为 maxint。
TiDB Lightningenable-diagnose-logs新增是否开启诊断日志。默认为 false,即只输出和导入有关的日志,不会输出依赖的其他组件的日志。设置为 true 后,既输出和导入相关的日志,也输出依赖的其他组件的日志,并开启 GRPC debug,可用于问题诊断。
TiDB Lightningtikv-importer.parallel-import新增TiDB Lightning 并行导入参数。用于替代原有的 tikv-importer.incremental-import 参数,因为原有参数会被误认为是增量导入的参数而误用。
BRazblob.encryption-key新增BR 为外部存储 Azure Blob Storage 提供加密密钥支持
BRazblob.encryption-scope新增BR 为外部存储 Azure Blob Storage 提供加密范围支持
TiCDClarge-message-handle-option新增默认为空,即消息大小超过 Kafka Topic 的限制后,同步任务失败。设置为 "handle-key-only" 时,如果消息超过大小,只发送 handle key 以减少消息的大小;如果依旧超过大小,则同步任务失败。
TiCDCsink.csv.binary-encoding-method新增CSV 协议中二进制类型数据的编码方式,可选 'base64''hex'。默认值为 'base64'

系统表

  • 新增系统表 mysql.tidb_timers 用来存储系统内部定时器的元信息。

废弃功能

  • TiDB

    • 统计信息的快速分析(实验特性)计划在 v7.5.0 中废弃。
    • 统计信息的增量收集(实验特性)计划在 v7.5.0 中废弃。

改进提升

错误修复

  • TiDB

    • 修复当使用 MySQL 的 Cursor Fetch 协议时,结果集占用的内存超过 tidb_mem_quota_query 的限制导致 TiDB OOM 的问题。修复后,TiDB 会自动将结果集写入磁盘以释放内存资源 #43233 @YangKeao
    • 修复数据争用导致 TiDB panic 的问题 #45561 @genliqi
    • 修复带 indexMerge 的查询被 kill 时可能会卡住的问题 #45279 @xzhangxian1008
    • 修复当开启 tidb_enable_parallel_apply 时,MPP 模式下的查询结果出错的问题 #45299 @windtalker
    • 修复 resolve lock 在 PD 时间跳变的情况下可能卡住的问题 #44822 @zyguan
    • 修复 GC resolve lock 可能错过一些悲观锁的问题 #45134 @MyonKeminta
    • 修复动态裁剪模式下使用了排序的查询返回结果错误的问题 #45007 @Defined2014
    • 修复 AUTO_INCREMENT 与列的默认值 DEFAULT 可以指定在同一列上的问题 #45136 @Defined2014
    • 修复某些情况下查询系统表 INFORMATION_SCHEMA.TIKV_REGION_STATUS 返回结果错误的问题 #45531 @Defined2014
    • 修复某些情况下分区表分区裁剪不正确的问题 #42273 @jiyfhust
    • 修复 TRUNCATE 分区表的某个分区时,全局索引无法清除的问题 #42435 @L-maple
    • 修复在 TiDB 节点故障后其它 TiDB 节点没有接管 TTL 任务的问题 #45022 @lcwangchao
    • 修复 TTL 运行过程中内存泄漏的问题 #45510 @lcwangchao
    • 修复向分区表插入数据时某些报错信息不准确的问题 #44966 @lilinghai
    • 修复 INFORMATION_SCHEMA.TIFLASH_REPLICA 表的读取权限有误的问题 #7795 @Lloyd-Pottiger
    • 修复使用错误分区表名时报错的问题 #44967 @River2000i
    • 修复某些情况下启用 tidb_enable_dist_task 时,创建索引卡住的问题 #44440 @tangenta
    • 修复通过 BR 恢复 AUTO_ID_CACHE=1 的表时,会遇到 duplicate entry 报错的问题 #44716 @tiancaiamao
    • 修复执行 TRUNCATE TABLE 消耗的时间和 ADMIN SHOW DDL JOBS 显示的任务执行时间不一致的问题 #44785 @tangenta
    • 修复读取元数据时间超过一个 DDL lease 导致升级 TiDB 卡住的问题 #45176 @zimulala
    • 修复 SELECT CAST(n AS CHAR) 语句中的 n 为负数时,查询结果出错的问题 #44786 @xhebox
    • 修复开启 tidb_opt_agg_push_down 时查询可能返回错误结果的问题 #44795 @AilinKid
    • 修复带有 current_date() 的查询使用 Plan Cache 导致结果错误的问题 #45086 @qw4990
  • TiKV

    • 修复在一些罕见的情况下,在 GC 的同时读取数据可能导致 TiKV panic 的问题 #15109 @MyonKeminta
  • PD

    • 修复重启 PD 可能导致 default 资源组被重新初始化的问题 #6787 @glorv
    • 修复当 etcd 已经启动,但 client 尚未连接上 etcd 时,调用 client 会导致 PD panic 的问题 #6860 @HuSharp
    • 修复 Region 的 health-check 输出可能与通过 ID 所查到的 Region 信息不一致的问题 #6560 @JmPotato
    • 修复 unsafe recovery 中失败的 learner peer 在 auto-detect 模式中被忽略的问题 #6690 @v01dstar
    • 修复 Placement Rules 选择了不满足规则的 TiFlash learner 的问题 #6662 @rleungx
    • 修复在 rule checker 选定 peer 时,unhealthy peer 无法被移除的问题 #6559 @nolouch
  • TiFlash

    • 修复由于死锁导致 TiFlash 无法成功同步分区表的问题 #7758 @hongyunyan
    • 修复系统表 INFORMATION_SCHEMA.TIFLASH_REPLICA 包含用户没有访问权限的表的问题 #7795 @Lloyd-Pottiger
    • 修复当同一个 MPP Task 内有多个 HashAgg 算子时,可能导致 MPP Task 编译时间过长而严重影响查询性能的问题 #7810 @SeaRise
  • Tools

    • TiCDC

      • 修复由于 PD 短暂不可用而导致同步任务报错的问题 #9294 @asddongmen
      • 修复 TiCDC 部分节点发生网络隔离时可能引发的数据不一致问题 #9344 @CharlesCheung96
      • 修复当 Kafka Sink 遇到错误时可能会无限阻塞同步任务推进的问题 #9309 @hicqu
      • 修复在 TiCDC 节点状态发生改变时可能引发的 panic 问题 #9354 @sdojjy
      • 修复对默认 ENUM 值编码错误的问题 #9259 @3AceShowHand
    • TiDB Lightning

      • 修复 TiDB Lightning 导入完成后执行 checksum 可能遇到 SSL 错误的问题 #45462 @D3Hunter
      • 修复逻辑导入模式下,导入期间下游删除表可能导致 TiDB Lightning 元信息未及时更新的问题 #44614 @dsdashun

贡献者

感谢来自 TiDB 社区的贡献者们: