TiDB Lightningチェックポイント

大規模なデータベースのインポートには、通常、数時間または数日かかります。長時間実行されているプロセスが誤ってクラッシュした場合、以前に完了したタスクをやり直すのに非常に時間がかかる可能性があります。これを解決するために、 TiDB Lightningはチェックポイントを使用してインポートの進行状況を保存し、 tidb-lightningが再起動後に中断したところからインポートを続行できるようにします。

このドキュメントでは、チェックポイントを有効化、構成、保存、および制御する方法について説明します。

チェックポイントを有効にして構成する

[checkpoint]
# Whether to enable checkpoints.
# While importing data, TiDB Lightning records which tables have been imported, so
# even if TiDB Lightning or some other component crashes, you can start from a known
# good state instead of restarting from scratch.
enable = true

# Where to store the checkpoints.
#  - file:  store as a local file (requires v2.1.1 or later)
#  - mysql: store into a remote MySQL-compatible database
driver = "file"

# The schema name (database name) to store the checkpoints
# Enabled only when `driver = "mysql"`.
# schema = "tidb_lightning_checkpoint"

# The data source name (DSN) indicating the location of the checkpoint storage.
#
# For the "file" driver, the DSN is a path. If the path is not specified, Lightning would
# default to "/tmp/CHECKPOINT_SCHEMA.pb".
#
# For the "mysql" driver, the DSN is a URL in the form of "USER:PASS@tcp(HOST:PORT)/".
# If the URL is not specified, the TiDB server from the [tidb] section is used to
# store the checkpoints. You should specify a different MySQL-compatible
# database server to reduce the load of the target TiDB cluster.
#dsn = "/tmp/tidb_lightning_checkpoint.pb"

# Whether to keep the checkpoints after all data are imported. If false, the
# checkpoints are deleted. Keeping the checkpoints can aid debugging but
# might leak metadata about the data source.
# keep-after-success = false

チェックポイントの保管

TiDB Lightningは、ローカル ファイルまたはリモートの MySQL 互換データベースの 2 種類のチェックポイント ストレージをサポートしています。

  • driver = "file"を指定すると、チェックポイントはdsn設定で指定されたパスのローカル ファイルに保存されます。チェックポイントは急速に更新されるため、チェックポイント ファイルは、RAM ディスクなど、書き込み耐性が非常に高いドライブに配置することを強くお勧めします。

  • driver = "mysql"を使用すると、MariaDB や TiDB など、 MySQL 5.7以降と互換性のある任意のデータベースにチェックポイントを保存できます。デフォルトでは、チェックポイントはターゲット データベースに保存されます。

ターゲット データベースをチェックポイント ストレージとして使用している間、Lightning は同時に大量のデータをインポートしています。これにより、ターゲット データベースに余分な負荷がかかり、場合によっては通信タイムアウトが発生します。したがって、一時的な MySQLサーバーをインストールしてこれらのチェックポイントを保存することを強くお勧めします。このサーバーはtidb-lightningと同じホストにインストールでき、インポーターの進行が完了した後にアンインストールできます。

チェックポイント制御

回復不能なエラー (データの破損など) が原因でtidb-lightningが異常終了した場合、エラーが解決されるまでチェックポイントの再利用を拒否します。事態の悪化を防ぐためです。チェックポイント エラーは、 tidb-lightning-ctlプログラムを使用して解決できます。

--checkpoint-error-destroy

tidb-lightning-ctl --checkpoint-error-destroy='`schema`.`table`'

このオプションを使用すると、テーブルのインポートを最初からやり直すことができます。スキーマ名とテーブル名は逆引用符で囲む必要があり、大文字と小文字が区別されます。

  • テーブル`schema`.`table`のインポートが以前に失敗した場合、このオプションは次の操作を実行します。

    1. ターゲット データベースからテーブル`schema`.`table`を削除します。これは、インポートされたすべてのデータを削除することを意味します。
    2. このテーブルのチェックポイント レコードを「まだ開始されていない」状態にリセットします。
  • テーブル`schema`.`table`に関連するエラーがない場合、この操作は何も行いません。

上記をすべてのテーブルに適用するのと同じです。これは、チェックポイント エラーの問題を解決するための最も便利で安全で保守的な解決策です。

tidb-lightning-ctl --checkpoint-error-destroy=all

--checkpoint-error-ignore

tidb-lightning-ctl --checkpoint-error-ignore='`schema`.`table`'
tidb-lightning-ctl --checkpoint-error-ignore=all

テーブル`schema`.`table`のインポートが以前に失敗した場合、これにより、何も起こらなかったかのようにエラー ステータスがクリアされます。 allバリアントは、この操作をすべてのテーブルに適用します。

ノート:

このオプションは、エラーが実際に無視できることが確実な場合にのみ使用してください。そうしないと、インポートされたデータの一部が失われる可能性があります。唯一の安全策は最終的な「チェックサム」チェックであるため、 --checkpoint-error-ignoreを使用するときは常に「チェックサム」オプションを有効にしておく必要があります。

--checkpoint-remove

tidb-lightning-ctl --checkpoint-remove='`schema`.`table`'
tidb-lightning-ctl --checkpoint-remove=all

このオプションは、ステータスに関係なく、1 つのテーブルまたはすべてのテーブルに関するすべてのチェックポイント情報を単純に削除します。

--checkpoint-dump

tidb-lightning-ctl --checkpoint-dump=output/directory

このオプションは、チェックポイントの内容を特定のディレクトリにダンプします。このディレクトリは、主に技術スタッフによるデバッグに使用されます。このオプションはdriver = "mysql"の場合にのみ有効です。

エコシステム
TiDB
TiKV
TiFlash
TiSpark
Chaos Mesh
© 2023 PingCAP. All Rights Reserved.