TiDB Lightningチュートリアル
TiDB Lightningは、大量のデータを TiDB クラスターに高速で完全にインポートするために使用されるツールです。現在、 TiDB Lightningは、SQL または CSV データ ソースを介してエクスポートされた SQL ダンプの読み取りをサポートしています。次の 2 つのシナリオで使用できます。
- 大量の新しいデータをすばやくインポート
- すべてのデータのバックアップと復元
前提条件
このチュートリアルでは、いくつかの新しいクリーンな CentOS 7 インスタンスを使用することを前提としています。 VMware、VirtualBox、またはその他のツールを使用して、仮想マシンをローカルに展開するか、ベンダー提供のプラットフォームに小規模なクラウド仮想マシンを展開できます。 TiDB Lightningは大量のコンピューター リソースを消費するため、最高のパフォーマンスで実行するには、少なくとも 16 GB のメモリと 32 コアの CPU を割り当てることをお勧めします。
フルバックアップデータを準備する
まず、 dumpling
を使用して MySQL からデータをエクスポートします。
./dumpling -h 127.0.0.1 -P 3306 -u root -t 16 -F 256MB -B test -f 'test.t[12]' -o /data/my_database/
上記のコマンドで:
-B test
: データがtest
データベースからエクスポートされることを意味します。-f test.t[12]
:test.t1
とtest.t2
のテーブルのみがエクスポートされることを意味します。-t 16
: データのエクスポートに 16 個のスレッドが使用されることを意味します。-F 256MB
: テーブルがチャンクに分割され、1 つのチャンクが 256 MB であることを意味します。
このコマンドを実行すると、フル バックアップ データが/data/my_database
ディレクトリにエクスポートされます。
TiDB Lightningをデプロイ
ステップ 1: TiDB クラスターをデプロイ
データをインポートする前に、TiDB クラスターをデプロイする必要があります。このチュートリアルでは、TiDB v5.4.0 を例として使用します。配備方法については、 TiUP を使用して TiDBクラスタをデプロイするを参照してください。
ステップ 2: TiDB Lightningインストール パッケージをダウンロードする
TiDB Lightningインストール パッケージはTiDB Toolkitに含まれています。 TiDB Toolkitをダウンロードするには、 TiDB ツールをダウンロードを参照してください。
ノート:
TiDB Lightningは、以前のバージョンの TiDB クラスターと互換性があります。 TiDB Lightningインストール パッケージの最新の安定バージョンをダウンロードすることをお勧めします。
ステップ 3: tidb-lightning
を開始する
パッケージ内の
bin/tidb-lightning
とbin/tidb-lightning-ctl
をTiDB Lightningがデプロイされているサーバーにアップロードします。準備されたデータ ソースをサーバーにアップロードします。
tidb-lightning.toml
を次のように構成します。[lightning] # Logging level = "info" file = "tidb-lightning.log" [tikv-importer] # Uses the Local-backend backend = "local" # Sets the directory for temporarily storing the sorted key-value pairs. # The target directory must be empty. sorted-kv-dir = "/mnt/ssd/sorted-kv-dir" [mydumper] # Local source data directory data-source-dir = "/data/my_datasource/" # Configures the wildcard rule. By default, all tables in the mysql, sys, INFORMATION_SCHEMA, PERFORMANCE_SCHEMA, METRICS_SCHEMA, and INSPECTION_SCHEMA system databases are filtered. # If this item is not configured, the "cannot find schema" error occurs when system tables are imported. filter = ['*.*', '!mysql.*', '!sys.*', '!INFORMATION_SCHEMA.*', '!PERFORMANCE_SCHEMA.*', '!METRICS_SCHEMA.*', '!INSPECTION_SCHEMA.*'] [tidb] # Information of the target cluster host = "172.16.31.2" port = 4000 user = "root" password = "rootroot" # Table schema information is fetched from TiDB via this status-port. status-port = 10080 # The PD address of the cluster pd-addr = "172.16.31.3:2379"パラメータを適切に設定したら、
nohup
コマンドを使用してtidb-lightning
プロセスを開始します。コマンドラインでコマンドを直接実行すると、SIGHUP シグナルを受信したためにプロセスが終了する場合があります。代わりに、nohup
コマンドを含む bash スクリプトを実行することをお勧めします。#!/bin/bash nohup ./tidb-lightning -config tidb-lightning.toml > nohup.out &
ステップ 4: データの整合性を確認する
インポートが完了すると、 TiDB Lightningは自動的に終了します。インポートが成功すると、ログ ファイルの最後の行にtidb lightning exit
が表示されます。
エラーが発生した場合は、 TiDB LightningFAQを参照してください。
概要
このチュートリアルでは、 TiDB Lightningとは何か、およびTiDB Lightningクラスターを迅速に展開してフル バックアップ データを TiDB クラスターにインポートする方法を簡単に紹介します。
TiDB Lightningの詳細な機能と使用方法については、 TiDB Lightningの概要を参照してください。