SQL性能チューニング

このドキュメントでは、SQL ステートメントが遅くなる一般的な理由と、SQL パフォーマンスをチューニングするためのテクニックを紹介します。

あなたが始める前に

tiup demoのインポートを使用してデータを準備できます。

tiup demo bookshop prepare --host 127.0.0.1 --port 4000 --books 1000000

または、事前に準備されたサンプルデータをインポートするにはTiDB Cloudのインポート機能を使用する。

問題: 全テーブルスキャン

SQL クエリが遅くなる最も一般的な理由は、 SELECTステートメントが全テーブルスキャンを実行するか、不適切なインデックスを使用することです。

TiDB が、プライマリキーまたはセカンダリインデックスではない列に基づいて大きなテーブルから少数の行を取得する場合、通常はパフォーマンスが低下します。

SELECT * FROM books WHERE title = 'Marian Yost';

+------------+-------------+-----------------------+---------------------+-------+--------+
| id         | title       | type                  | published_at        | stock | price  |
+------------+-------------+-----------------------+---------------------+-------+--------+
| 65670536   | Marian Yost | Arts                  | 1950-04-09 06:28:58 | 542   | 435.01 |
| 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216   | 328.18 |
| 1414277591 | Marian Yost | Arts                  | 1932-06-15 09:18:14 | 303   | 496.52 |
| 2305318593 | Marian Yost | Arts                  | 2000-08-15 19:40:58 | 398   | 402.90 |
| 2638226326 | Marian Yost | Sports                | 1952-04-02 12:40:37 | 191   | 174.64 |
+------------+-------------+-----------------------+---------------------+-------+--------+
5 rows in set
Time: 0.582s

このクエリが遅い理由を理解するには、 EXPLAINを使用して実行計画を確認します。

EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';

+---------------------+------------+-----------+---------------+-----------------------------------------+
| id                  | estRows    | task      | access object | operator info                           |
+---------------------+------------+-----------+---------------+-----------------------------------------+
| TableReader_7       | 1.27       | root      |               | data:Selection_6                        |
| └─Selection_6       | 1.27       | cop[tikv] |               | eq(bookshop.books.title, "Marian Yost") |
|   └─TableFullScan_5 | 1000000.00 | cop[tikv] | table:books   | keep order:false                        |
+---------------------+------------+-----------+---------------+-----------------------------------------+

実行計画のTableFullScan_5からわかるように、TiDB はbooksのテーブルに対してフルテーブルスキャンを実行し、 titleが各行の条件を満たすかどうかをチェックします。 TableFullScan_5のestRowsの値は1000000.00です。これは、オプティマイザーが、この全表スキャンに1000000.00行のデータが必要であると見積もることを意味します。

EXPLAINの使用方法の詳細については、 EXPLAINウォークスルーを参照してください。

解決策: セカンダリインデックスを使用する

上記のクエリを高速化するには、 books.title列にセカンダリインデックスを追加します。

CREATE INDEX title_idx ON books (title);

クエリの実行ははるかに高速です。

SELECT * FROM books WHERE title = 'Marian Yost';

+------------+-------------+-----------------------+---------------------+-------+--------+
| id         | title       | type                  | published_at        | stock | price  |
+------------+-------------+-----------------------+---------------------+-------+--------+
| 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216   | 328.18 |
| 1414277591 | Marian Yost | Arts                  | 1932-06-15 09:18:14 | 303   | 496.52 |
| 2305318593 | Marian Yost | Arts                  | 2000-08-15 19:40:58 | 398   | 402.90 |
| 2638226326 | Marian Yost | Sports                | 1952-04-02 12:40:37 | 191   | 174.64 |
| 65670536   | Marian Yost | Arts                  | 1950-04-09 06:28:58 | 542   | 435.01 |
+------------+-------------+-----------------------+---------------------+-------+--------+
5 rows in set
Time: 0.007s

パフォーマンスが向上した理由を理解するには、 EXPLAINを使用して新しい実行計画を表示します。

EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';

+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
| id                        | estRows | task      | access object                       | operator info                                         |
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
| IndexLookUp_10            | 1.27    | root      |                                     |                                                       |
| ├─IndexRangeScan_8(Build) | 1.27    | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false |
| └─TableRowIDScan_9(Probe) | 1.27    | cop[tikv] | table:books                         | keep order:false                                      |
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+

実行計画のIndexLookup_10からわかるように、TiDB はtitle_idxのインデックスでデータをクエリします。そのestRowsの値は1.27です。これは、オプティマイザが1.27行のみがスキャンされると見積もることを意味します。スキャンされた推定行数は、全表スキャンの1000000.00行のデータよりもはるかに少なくなっています。

IndexLookup_10の実行計画は、最初にIndexRangeScan_8演算子を使用してtitle_idxインデックスを介して条件を満たすインデックスデータを読み取り、次にTableLookup_9演算子を使用して、インデックスデータに格納されている行 ID に従って対応する行をクエリします。

TiDB 実行計画の詳細については、 TiDB クエリ実行計画の概要を参照してください。

解決策: カバリングインデックスを使用する

インデックスが、SQL ステートメントによってクエリされるすべての列を含むカバリングインデックスである場合、クエリにはインデックスデータのスキャンで十分です。

たとえば、次のクエリでは、 titleに基づいて対応するpriceをクエリするだけで済みます。

SELECT title, price FROM books WHERE title = 'Marian Yost';

+-------------+--------+
| title       | price  |
+-------------+--------+
| Marian Yost | 435.01 |
| Marian Yost | 328.18 |
| Marian Yost | 496.52 |
| Marian Yost | 402.90 |
| Marian Yost | 174.64 |
+-------------+--------+
5 rows in set
Time: 0.007s

title_idx番目のインデックスにはtitle列のデータしか含まれていないため、TiDB は最初にインデックスデータをスキャンしてから、テーブルのprice列をクエリする必要があります。

EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';

+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
| id                        | estRows | task      | access object                       | operator info                                         |
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
| IndexLookUp_10            | 1.27    | root      |                                     |                                                       |
| ├─IndexRangeScan_8(Build) | 1.27    | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false |
| └─TableRowIDScan_9(Probe) | 1.27    | cop[tikv] | table:books                         | keep order:false                                      |
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+

パフォーマンスを最適化するには、 title_idxインデックスを削除して、新しいカバリングインデックスtitle_price_idxを作成します。

ALTER TABLE books DROP INDEX title_idx;

CREATE INDEX title_price_idx ON books (title, price);

price番目のデータはtitle_price_idx番目のインデックスに格納されているため、次のクエリではインデックスデータをスキャンするだけで済みます。

EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';

--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+
| id                 | estRows | task      | access object                                    | operator info                                         |
+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+
| IndexReader_6      | 1.27    | root      |                                                  | index:IndexRangeScan_5                                |
| └─IndexRangeScan_5 | 1.27    | cop[tikv] | table:books, index:title_price_idx(title, price) | range:["Marian Yost","Marian Yost"], keep order:false |
+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+

このクエリはより高速に実行されるようになりました。

SELECT title, price FROM books WHERE title = 'Marian Yost';

+-------------+--------+
| title       | price  |
+-------------+--------+
| Marian Yost | 174.64 |
| Marian Yost | 328.18 |
| Marian Yost | 402.90 |
| Marian Yost | 435.01 |
| Marian Yost | 496.52 |
+-------------+--------+
5 rows in set
Time: 0.004s

booksテーブルは後の例で使用されるため、 title_price_idxインデックスを削除します。

ALTER TABLE books DROP INDEX title_price_idx;

解決策: プライマリインデックスを使用する

クエリが主キーを使用してデータをフィルター処理する場合、クエリは高速に実行されます。たとえば、 booksテーブルの主キーはid列なので、 id列を使用してデータをクエリできます。

SELECT * FROM books WHERE id = 896;

+-----+----------------+----------------------+---------------------+-------+--------+
| id  | title          | type                 | published_at        | stock | price  |
+-----+----------------+----------------------+---------------------+-------+--------+
| 896 | Kathryne Doyle | Science & Technology | 1969-03-18 01:34:15 | 468   | 281.32 |
+-----+----------------+----------------------+---------------------+-------+--------+
1 row in set
Time: 0.004s

実行計画を表示するには、 EXPLAINを使用します。

EXPLAIN SELECT * FROM books WHERE id = 896;

+-------------+---------+------+---------------+---------------+
| id          | estRows | task | access object | operator info |
+-------------+---------+------+---------------+---------------+
| Point_Get_1 | 1.00    | root | table:books   | handle:896    |
+-------------+---------+------+---------------+---------------+

Point_Getは非常に高速な実行プランです。

適切な結合タイプを使用する

JOIN実行計画を参照してください。

SQL性能チューニング

あなたが始める前に

問題: 全テーブル スキャン

解決策: セカンダリ インデックスを使用する

解決策: カバリング インデックスを使用する

解決策: プライマリ インデックスを使用する

適切な結合タイプを使用する

こちらもご覧ください

問題: 全テーブルスキャン

解決策: セカンダリインデックスを使用する

解決策: カバリングインデックスを使用する

解決策: プライマリインデックスを使用する