より多くの列を持つ下流の TiDB テーブルにデータを移行する

このドキュメントでは、対応する上流のテーブルよりも多くの列を持つ下流の TiDB テーブルにデータを移行するときに実行する追加の手順について説明します。通常の移行手順については、次の移行シナリオを参照してください。

DM を使用して、より多くの列を持つ下流の TiDB テーブルにデータを移行する

アップストリーム バイナリログをレプリケートするとき、DM はダウンストリームの現在のテーブル スキーマを使用してバイナリログを解析し、対応する DML ステートメントを生成しようとします。アップストリーム バイナリログのテーブルの列番号がダウンストリーム テーブル スキーマの列番号と一致しない場合、次のエラーが発生します。

"errors": [ { "ErrCode": 36027, "ErrClass": "sync-unit", "ErrScope": "internal", "ErrLevel": "high", "Message": "startLocation: [position: (mysql-bin.000001, 2022), gtid-set:09bec856-ba95-11ea-850a-58f2b4af5188:1-9 ], endLocation: [ position: (mysql-bin.000001, 2022), gtid-set: 09bec856-ba95-11ea-850a-58f2b4af5188:1-9]: gen insert sqls failed, schema: log, table: messages: Column count doesn't match value count: 3 (columns) vs 2 (values)", "RawCause": "", "Workaround": "" } ]

以下は、アップストリーム テーブル スキーマの例です。

# Upstream table schema CREATE TABLE `messages` ( `id` int(11) NOT NULL, PRIMARY KEY (`id`) )

以下は、ダウンストリーム テーブル スキーマの例です。

# Downstream table schema CREATE TABLE `messages` ( `id` int(11) NOT NULL, `message` varchar(255) DEFAULT NULL, # This is the additional column that only exists in the downstream table. PRIMARY KEY (`id`) )

DM がダウンストリーム テーブル スキーマを使用して、アップストリームによって生成された binlog イベントを解析しようとすると、DM は上記のColumn count doesn't matchのエラーを報告します。

このような場合は、 binlog-schemaコマンドを使用して、データ ソースから移行するテーブルのテーブル スキーマを設定できます。指定されたテーブル スキーマは、DM によってレプリケートされるバイナリ ログ イベント データに対応している必要があります。シャード テーブルを移行する場合は、シャード テーブルごとに、DM でテーブル スキーマを設定して binlog イベント データを解析する必要があります。手順は次のとおりです。

  1. DM で SQL ファイルを作成し、上流のテーブル スキーマに対応するCREATE TABLEのステートメントをファイルに追加します。たとえば、次のテーブル スキーマをlog.messages.sqlに保存します。

    # Upstream table schema CREATE TABLE `messages` ( `id` int(11) NOT NULL, PRIMARY KEY (`id`) )
  2. binlog-schemaコマンドを使用して、データ ソースから移行するテーブルのテーブル スキーマを設定します。この時点で、データ移行タスクは上記Column count doesn't matchのエラーにより一時停止状態になっているはずです。

    tiup dmctl --master-addr ${advertise-addr} binlog-schema update -s ${source-id} ${task-name} ${database-name} ${table-name} ${schema-file}

    このコマンドのパラメータの説明は次のとおりです。

    パラメータ説明
    -master-addrdmctl が接続されるクラスター内の任意の DM マスター ノードの${advertise-addr}を指定します。 ${advertise-addr}は、DM-master が外部にアドバタイズするアドレスを示します。
    binlog-schema setスキーマ情報を手動で設定します。
    -sソースを指定します。 ${source-id}は MySQL データのソース ID を示します。
    ${task-name}データ移行タスクのtask.yamlの構成ファイルで定義されている移行タスクの名前を指定します。
    ${database-name}データベースを指定します。 ${database-name}は上流データベースの名前を示します。
    ${table-name}アップストリーム テーブルの名前を指定します。
    ${schema-file}設定するテーブルスキーマファイルを指定します。

    例えば:

    tiup dmctl --master-addr 172.16.10.71:8261 binlog-schema update -s mysql-01 task-test -d log -t message log.message.sql
  3. resume-taskコマンドを使用して、一時停止状態の移行タスクを再開します。

    tiup dmctl --master-addr ${advertise-addr} resume-task ${task-name}
  4. query-statusコマンドを使用して、データ移行タスクが正しく実行されていることを確認します。

    tiup dmctl --master-addr ${advertise-addr} query-status resume-task ${task-name}