インデックスマージを使用したステートメントの説明

IndexMergeは、テーブルにアクセスするために TiDB v4.0 で導入された方法です。この方法を使用すると、TiDB オプティマイザーはテーブルごとに複数のインデックスを使用し、各インデックスから返された結果をマージできます。一部のシナリオでは、この方法を使用すると、テーブル全体のスキャンが回避されるため、クエリがより効率的になります。

mysql> EXPLAIN SELECT * from t where a = 1 or b = 1;
+-------------------------+----------+-----------+---------------+--------------------------------------+
| id                      | estRows  | task      | access object | operator info                        |
+-------------------------+----------+-----------+---------------+--------------------------------------+
| TableReader_7           | 8000.00  | root      |               | data:Selection_6                     |
| └─Selection_6           | 8000.00  | cop[tikv] |               | or(eq(test.t.a, 1), eq(test.t.b, 1)) |
|   └─TableFullScan_5     | 10000.00 | cop[tikv] | table:t       | keep order:false, stats:pseudo       |
+-------------------------+----------+-----------+---------------+--------------------------------------+
mysql> set @@tidb_enable_index_merge = 1;
mysql> explain select * from t use index(idx_a, idx_b) where a > 1 or b > 1;
+--------------------------------+---------+-----------+-------------------------+------------------------------------------------+
| id                             | estRows | task      | access object           | operator info                                  |
+--------------------------------+---------+-----------+-------------------------+------------------------------------------------+
| IndexMerge_16                  | 6666.67 | root      |                         |                                                |
| ├─IndexRangeScan_13(Build)     | 3333.33 | cop[tikv] | table:t, index:idx_a(a) | range:(1,+inf], keep order:false, stats:pseudo |
| ├─IndexRangeScan_14(Build)     | 3333.33 | cop[tikv] | table:t, index:idx_b(b) | range:(1,+inf], keep order:false, stats:pseudo |
| └─TableRowIDScan_15(Probe)     | 6666.67 | cop[tikv] | table:t                 | keep order:false, stats:pseudo                 |
+--------------------------------+---------+-----------+-------------------------+------------------------------------------------+

上記のクエリでは、フィルター条件はORを結合子として使用するWHERE句です。 IndexMergeがない場合、テーブルごとに 1 つのインデックスしか使用できません。 a = 1をインデックスaにプッシュダウンすることはできません。どちらもb = 1をインデックスbにプッシュすることはできません。 tに大量のデータが存在する場合、全表スキャンは非効率的です。このようなシナリオを処理するために、テーブルにアクセスするためにIndexMergeが TiDB に導入されました。

IndexMergeを指定すると、オプティマイザはテーブルごとに複数のインデックスを使用し、各インデックスによって返された結果をマージして、上の図の後者IndexMergeの実行計画を生成できます。ここで、 IndexMerge_16演算子は 3 つの子ノードを持ち、そのうちIndexRangeScan_13とIndexRangeScan_14は範囲スキャンの結果に基づいて条件を満たすすべてのRowIDを取得し、 TableRowIDScan_15演算子はこれらのRowIDに従って条件を満たすすべてのデータを正確に読み取ります。 .

IndexRangeScan / TableRangeScanなどの特定の範囲のデータに対して実行されるスキャン操作の場合、結果のoperator info列には、 IndexFullScan / TableFullScanなどの他のスキャン操作と比較して、スキャン範囲に関する追加情報が含まれます。上記の例では、 IndexRangeScan_13演算子のrange:(1,+inf]は、演算子が 1 から正の無限大までデータをスキャンすることを示します。

ノート：
インデックスマージ機能は、v5.4.0 からデフォルトで有効になっています。つまり、 tidb_enable_index_mergeはONです。
tidb_enable_index_mergeの設定に関係なく、SQL ヒントUSE_INDEX_MERGEを使用して、オプティマイザーにインデックスマージを強制的に適用させることができます。フィルター条件にプッシュダウンできない式が含まれている場合にインデックスマージを有効にするには、SQL ヒントUSE_INDEX_MERGEを使用する必要があります。
インデックスマージは、論理和正規形 ( orで接続された式) のみをサポートし、論理和正規形 ( andで接続された式) はサポートしません。
現時点では、インデックスマージは一時テーブルではサポートされていません。

インデックス マージを使用したステートメントの説明

インデックスマージを使用したステートメントの説明