GH-ost/PT-osc を使用するデータベースからの移行

運用シナリオでは、DDL 実行中にテーブルをロックすると、データベースからの読み取りまたはデータベースへの書き込みがある程度ブロックされる可能性があります。そのため、オンライン DDL ツールを使用して DDL を実行し、読み取りと書き込みへの影響を最小限に抑えることがよくあります。一般的な DDL ツールは幽霊pt-oscです。

DM を使用して MySQL から TiDB にデータを移行する場合、online-ddl を有効にして、DM と gh-ost または pt-osc のコラボレーションを許可できます。 online-ddl を有効にする方法と、このオプションを有効にした後のワークフローの詳細については、 gh-ost または pt-osc による連続レプリケーションを参照してください。このドキュメントでは、DM とオンライン DDL ツールのコラボレーションの詳細に焦点を当てています。

オンライン DDL ツールを使用した DM の作業の詳細

このセクションでは、online-schema-change を実装する際のオンライン DDL ツール幽霊およびpt-oscを使用した DM の作業の詳細について説明します。

オンラインスキーマ変更: gh-ost

gh-ost が online-schema-change を実装すると、3 種類のテーブルが作成されます。

  • gho: DDL の適用に使用されます。データが完全に複製され、gho テーブルが元のテーブルと一致する場合、元のテーブルは名前変更によって置き換えられます。
  • ghc: online-schema-change に関連する情報を格納するために使用されます。
  • del: 元のテーブルの名前を変更して作成されます。

移行の過程で、DM は上記の表を 3 つのカテゴリに分けます。

  • ゴーストテーブル: _*_gho
  • ゴミ箱テーブル: _*_ghc , _*_del
  • realTable: online-ddl を実行する元のテーブル。

gh-ost で主に使用される SQL ステートメントと、対応する DM の操作は次のとおりです。

  1. _ghcのテーブルを作成します。

    Create /* gh-ost */ table `test`.`_test4_ghc` ( id bigint auto_increment, last_update timestamp not null DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, hint varchar(64) charset ascii not null, value varchar(4096) charset ascii not null, primary key(id), unique key hint_uidx(hint) ) auto_increment=256 ;

    DM は_test4_ghcテーブルを作成しません。

  2. _ghoのテーブルを作成します。

    Create /* gh-ost */ table `test`.`_test4_gho` like `test`.`test4` ;

    DM は_test4_ghoテーブルを作成しません。 DM は、 server_id ghost_schema ghost_table dm_workerdm_meta.{task_name}_onlineddlレコードを削除し、メモリ内の関連情報をクリアします。

    DELETE FROM dm_meta.{task_name}_onlineddl WHERE id = {server_id} and ghost_schema = {ghost_schema} and ghost_table = {ghost_table};
  3. _ghoテーブルで実行する必要がある DDL を適用します。

    Alter /* gh-ost */ table `test`.`_test4_gho` add column cl1 varchar(20) not null ;

    DM は_test4_ghoの DDL 操作を実行しません。このDDLをdm_meta.{task_name}_onlineddl 、メモリに記録します。

    REPLACE INTO dm_meta.{task_name}_onlineddl (id, ghost_schema , ghost_table , ddls) VALUES (......);
  4. _ghcテーブルにデータを書き込み、元のテーブル データを_ghoテーブルにレプリケートします。

    INSERT /* gh-ost */ INTO `test`.`_test4_ghc` VALUES (......); INSERT /* gh-ost `test`.`test4` */ ignore INTO `test`.`_test4_gho` (`id`, `date`, `account_id`, `conversion_price`, `ocpc_matched_conversions`, `ad_cost`, `cl2`) (SELECT `id`, `date`, `account_id`, `conversion_price`, `ocpc_matched_conversions`, `ad_cost`, `cl2` FROM `test`.`test4` FORCE INDEX (`PRIMARY`) WHERE (((`id` > _binary'1') OR ((`id` = _binary'1'))) AND ((`id` < _binary'2') OR ((`id` = _binary'2')))) lock IN share mode ) ;

    DM は、 realtable用ではない DML ステートメントを実行しません。

  5. 移行が完了すると、元のテーブルと_ghoのテーブルの名前が変更され、オンライン DDL 操作が完了します。

    Rename /* gh-ost */ table `test`.`test4` to `test`.`_test4_del`, `test`.`_test4_gho` to `test`.`test4`;

    DM は次の 2 つの操作を実行します。

    • DM は、上記のrenameつの操作を 2 つの SQL ステートメントに分割します。

      rename test.test4 to test._test4_del; rename test._test4_gho to test.test4;
    • DM は実行しませんrename to _test4_delrename ghost_table to origin tableを実行すると、DM は次の手順を実行します。

      • 手順 3 でメモリに記録された DDL を読み取る
      • ghost_tableghost_schemaorigin_tableとそれに対応するスキーマに置き換えます
      • 置き換えたDDLを実行
      alter table test._test4_gho add column cl1 varchar(20) not null; -- Replaced with: alter table test.test4 add column cl1 varchar(20) not null;

ノート:

gh-ost の特定の SQL ステートメントは、実行に使用されるパラメーターによって異なります。このドキュメントでは、主要な SQL ステートメントのみをリストしています。詳細については、 ゴーストオストのドキュメントを参照してください。

オンラインスキーマ変更: pt

pt-osc が online-schema-change を実装すると、2 種類のテーブルが作成されます。

  • new : DDL の適用に使用されます。データが完全に複製され、表newが元の表と一致する場合、元の表は名前変更によって置き換えられます。
  • old : 元のテーブルの名前を変更して作成。
  • トリガーの 3 種類: pt_osc_*_inspt_osc_*_updpt_osc_*_del 。 pt_osc のプロセスでは、元のテーブルによって生成された新しいデータがトリガーによってnewに複製されます。

移行の過程で、DM は上記の表を 3 つのカテゴリに分けます。

  • ゴーストテーブル: _*_new
  • ゴミ箱テーブル: _*_old
  • realTable: online-ddl を実行する元のテーブル。

主に pt-osc で使用される SQL ステートメントと、対応する DM の操作は次のとおりです。

  1. _newのテーブルを作成します。

    CREATE TABLE `test`.`_test4_new` ( id int(11) NOT NULL AUTO_INCREMENT, date date DEFAULT NULL, account_id bigint(20) DEFAULT NULL, conversion_price decimal(20,3) DEFAULT NULL, ocpc_matched_conversions bigint(20) DEFAULT NULL, ad_cost decimal(20,3) DEFAULT NULL,cl2 varchar(20) COLLATE utf8mb4_bin NOT NULL,cl1 varchar(20) COLLATE utf8mb4_bin NOT NULL,PRIMARY KEY (id) ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin ;

    DM は_test4_newテーブルを作成しません。 DM は、 server_id ghost_schema ghost_table dm_workerdm_meta.{task_name}_onlineddlレコードを削除し、メモリ内の関連情報をクリアします。

    DELETE FROM dm_meta.{task_name}_onlineddl WHERE id = {server_id} and ghost_schema = {ghost_schema} and ghost_table = {ghost_table};
  2. _newテーブルで DDL を実行します。

    ALTER TABLE `test`.`_test4_new` add column c3 int;

    DM は_test4_newの DDL 操作を実行しません。代わりに、この DDL をdm_meta.{task_name}_onlineddlおよびメモリに記録します。

    REPLACE INTO dm_meta.{task_name}_onlineddl (id, ghost_schema , ghost_table , ddls) VALUES (......);
  3. データ移行に使用する 3 つのトリガーを作成します。

    CREATE TRIGGER `pt_osc_test_test4_del` AFTER DELETE ON `test`.`test4` ...... ; CREATE TRIGGER `pt_osc_test_test4_upd` AFTER UPDATE ON `test`.`test4` ...... ; CREATE TRIGGER `pt_osc_test_test4_ins` AFTER INSERT ON `test`.`test4` ...... ;

    DM は、TiDB でサポートされていないトリガー操作を実行しません。

  4. 元のテーブル データを_newのテーブルに複製します。

    INSERT LOW_PRIORITY IGNORE INTO `test`.`_test4_new` (`id`, `date`, `account_id`, `conversion_price`, `ocpc_matched_conversions`, `ad_cost`, `cl2`, `cl1`) SELECT `id`, `date`, `account_id`, `conversion_price`, `ocpc_matched_conversions`, `ad_cost`, `cl2`, `cl1` FROM `test`.`test4` LOCK IN SHARE MODE /*pt-online-schema-change 3227 copy table*/

    DM は、 realtable用ではない DML ステートメントを実行しません。

  5. データの移行が完了すると、元のテーブルと_newのテーブルの名前が変更され、オンライン DDL 操作が完了します。

    RENAME TABLE `test`.`test4` TO `test`.`_test4_old`, `test`.`_test4_new` TO `test`.`test4`

    DM は次の 2 つの操作を実行します。

    • DM は、上記のrenameつの操作を 2 つの SQL ステートメントに分割します。

      rename test.test4 to test._test4_old; rename test._test4_new to test.test4;
    • DM は実行しませんrename to _test4_oldrename ghost_table to origin tableを実行すると、DM は次の手順を実行します。

      • 手順 2 でメモリに記録された DDL を読み取る
      • ghost_tableghost_schemaorigin_tableとそれに対応するスキーマに置き換えます
      • 置き換えたDDLを実行
      ALTER TABLE `test`.`_test4_new` add column c3 int; -- Replaced with: ALTER TABLE `test`.`test4` add column c3 int;
  6. オンライン DDL 操作の_oldのテーブルと 3 つのトリガーを削除します。

    DROP TABLE IF EXISTS `test`.`_test4_old`; DROP TRIGGER IF EXISTS `pt_osc_test_test4_del` AFTER DELETE ON `test`.`test4` ...... ; DROP TRIGGER IF EXISTS `pt_osc_test_test4_upd` AFTER UPDATE ON `test`.`test4` ...... ; DROP TRIGGER IF EXISTS `pt_osc_test_test4_ins` AFTER INSERT ON `test`.`test4` ...... ;

    DMは_test4_oldとトリガーを削除しません。

ノート:

pt-osc の特定の SQL ステートメントは、実行で使用されるパラメーターによって異なります。このドキュメントでは、主要な SQL ステートメントのみをリストしています。詳細については、 pt-osc ドキュメントを参照してください。

その他のオンライン スキーマ変更ツール

場合によっては、オンライン スキーマ変更ツールのデフォルトの動作を変更する必要があります。たとえば、 ghost tabletrash tableにカスタマイズされた名前を使用できます。それ以外の場合は、gh-ost や pt-osc の代わりに、同じ動作原理と変更プロセスを持つ他のツールを使用したい場合があります。

このようなカスタマイズされたニーズを実現するには、 ghost tabletrash tableの名前に一致する正規表現を記述する必要があります。

v2.0.7 から、DM は実験的に変更されたオンライン スキーマ変更ツールをサポートします。 DM タスク構成でonline-ddl=trueを設定し、 shadow-table-rulestrash-table-rulesを構成することで、変更された一時テーブルを正規表現と照合できます。

たとえば、 ghost tableの名前が_{origin_table}_pcnewtrash tableの名前が_{origin_table}_pcoldであるカスタマイズされた pt-osc を使用する場合、次のようにカスタム ルールを設定できます。

online-ddl: true shadow-table-rules: ["^_(.+)_(?:pcnew)$"] trash-table-rules: ["^_(.+)_(?:pcold)$"]