gh-ost または pt-osc を使用するデータベースからの連続レプリケーション

運用シナリオでは、DDL 実行中にテーブルをロックすると、データベースからの読み取りまたはデータベースへの書き込みがある程度ブロックされる可能性があります。そのため、オンライン DDL ツールを使用して DDL を実行し、読み取りと書き込みへの影響を最小限に抑えることがよくあります。一般的な DDL ツールは幽霊pt-oscです。

DM を使用して MySQL から TiDB にデータを移行する場合、DM と gh-ost または pt-osc のコラボレーションを許可するためにonline-ddlを有効にすることができます。

詳細なレプリケーション手順については、シナリオごとに次のドキュメントを参照してください。

DM で online-ddl を有効にする

DM のタスク構成ファイルで、以下に示すように、グローバル パラメーターonline-ddlからtrueを設定します。

# ----------- Global configuration ----------- ## ********* Basic configuration ********* name: test # The name of the task. Should be globally unique. task-mode: all # The task mode. Can be set to `full`, `incremental`, or `all`. shard-mode: "pessimistic" # The shard merge mode. Optional modes are `pessimistic` and `optimistic`. The `pessimistic` mode is used by default. After understanding the principles and restrictions of the "optimistic" mode, you can set it to the "optimistic" mode. meta-schema: "dm_meta" # The downstream database that stores the `meta` information. online-ddl: true # Enable online-ddl support on DM to support automatic processing of "gh-ost" and "pt-osc" for the upstream database.

online-ddl を有効にした後のワークフロー

DM で online-ddl を有効にすると、DM が gh-ost または pt-osc をレプリケートすることによって生成される DDL ステートメントが変更されます。

gh-ost または pt-osc のワークフロー:

  • DDL実表の表スキーマに従ってゴースト表を作成します。

  • ゴースト テーブルに DDL を適用します。

  • DDL 実表のデータをゴースト表に複製します。

  • 2 つのテーブル間でデータの整合性が取れたら、rename ステートメントを使用して実際のテーブルをゴースト テーブルに置き換えます。

DMのワークフロー:

  • ゴースト テーブルのダウンストリームの作成をスキップします。

  • ゴースト テーブルに適用された DDL を記録します。

  • ゴースト テーブルからのみデータをレプリケートします。

  • ダウンストリームで記録された DDL を適用します。

dm-online-ddl

ワークフローの変更により、次の利点がもたらされます。

  • ダウンストリームの TiDB は、ゴースト テーブルを作成して複製する必要がないため、ストレージ スペースとネットワーク転送のオーバーヘッドが節約されます。

  • シャード テーブルからデータを移行およびマージする場合、レプリケーションの正確性を確保するために、シャード ゴースト テーブルごとに RENAME 操作が無視されます。

こちらもご覧ください

オンライン DDL ツールを使用した DM の作業の詳細