PITR を使用する

このドキュメントでは、関連するツールを展開し、ポイント イン タイム リカバリ (PITR) を使用する方法について説明します。この機能を使い始めるのに役立つことを目的としています。

AWS の本番環境に TiDB クラスターをデプロイし、ビジネス チームが次の要件を提案したとします。

  • データの変更を適時にバックアップします。データベースでエラーが発生した場合、最小限のデータ損失でアプリケーション データを迅速に回復できます (数分間のデータ損失のみが許容されます)。
  • 毎月特定の時間にビジネス監査を実行します。監査要求を受け取ったら、要求に応じて過去 1 か月の特定の時点でデータをクエリするためのデータベースを提供する必要があります。

PITR を使用すると、上記の要件を満たすことができます。

TiDB クラスターと BR をデプロイ

PITR を使用するには、TiDB クラスター >= v6.2.0 をデプロイし、BR を TiDB クラスターと同じバージョンに更新する必要があります。このドキュメントでは、例として v6.2.0 を使用しています。

次の表は、TiDB クラスターで PITR を使用するために推奨されるハードウェア リソースを示しています。

成分CPUメモリーローカルストレージAWS インスタンスインスタンス数
TiDB8コア+16GB以上SASc5.2xlarge2
PD8コア+16GB以上SSDc5.2xlarge3
TiKV8コア+32GB以上SSDm5.2x大3
ブラジル8コア+16GB以上SASc5.2xlarge1
モニター8コア+16GB以上SASc5.2xlarge1

ノート:

  • BR がバックアップおよび復元タスクを実行するとき、PD および TiKV にアクセスする必要があります。 BR とすべての PD および TiKV サーバーが接続されていることを確認します。
  • BR サーバーと PD サーバーは同じタイム ゾーンを使用する必要があります。

TiUP を使用して TiDB クラスターをデプロイまたはアップグレードします。

TiUP を使用して BR をインストールまたはアップグレードします。

  • インストール: tiup install br:v6.2.0を実行します。
  • アップグレード: tiup update br:v6.2.0を実行します。

ログのバックアップを有効にする

ログ バックアップを使用する前に、TiKV 構成ファイルのlog-backup.enableが既定値のtrueであることを確認してください。設定変更方法は構成を変更するを参照してください。

バックアップ ストレージの構成 (Amazon S3)

バックアップ タスクを開始する前に、次の点を含めてバックアップ ストレージを準備します。

  1. バックアップデータを格納する S3 バケットとディレクトリを準備します。
  2. S3 バケットにアクセスする権限を設定します。
  3. バックアップ データを格納するディレクトリを計画します。

詳細な手順は次のとおりです。

  1. バックアップデータを保存するディレクトリを S3 に作成します。この例のディレクトリはs3://tidb-pitr-bucket/backup-dataです。

    1. バケットを作成します。バックアップ データを保存する既存の S3 を選択できます。無い場合はAWS ドキュメント - バケットの作成を参照してS3バケットを作成してください。この例では、バケット名はtidb-pitr-bucketです。
    2. バックアップ データ用のディレクトリを作成します。バケット ( tidb-pitr-bucket ) で、 backup-dataという名前のディレクトリを作成します。詳細な手順については、 AWS ドキュメント - フォルダを使用して Amazon S3 コンソールでオブジェクトを整理するを参照してください。
  2. S3 ディレクトリにアクセスするための BR と TiKV のアクセス許可を構成します。 S3 バケットにアクセスする最も安全な方法であるIAMメソッドを使用してアクセス許可を付与することをお勧めします。詳細な手順については、 AWS ドキュメント - ユーザー ポリシーによるバケットへのアクセスの制御を参照してください。必要な権限は次のとおりです。

    • バックアップ クラスター内の TiKV および BR には、 s3://tidb-pitr-bucket/backup-dataディレクトリのs3:ListBuckets3:PutObject 、およびs3:AbortMultipartUploadのアクセス許可が必要です。
    • 復元クラスタの TiKV と BR には、 s3://tidb-pitr-bucket/backup-dataディレクトリのs3:ListBuckets3:GetObjectの権限が必要です。
  3. スナップショット (完全) バックアップとログ バックアップを含む、バックアップ データを格納するディレクトリ構造を計画します。

    • すべてのスナップショット バックアップ データは、 s3://tidb-pitr-bucket/backup-data/snapshot-${date}ディレクトリに格納されます。 ${date}は、スナップショット バックアップの開始時刻です。たとえば、2022/05/12 00:01:30 から始まるスナップショット バックアップはs3://tidb-pitr-bucket/backup-data/snapshot-20220512000130に格納されます。
    • ログバックアップデータはs3://tidb-pitr-bucket/backup-data/log-backup/ディレクトリに格納されます。

バックアップ ポリシーを決定する

最小限のデータ損失、迅速な復旧、および 1 か月以内のビジネス監査の要件を満たすために、次のようにバックアップ ポリシーを設定できます。

  • ログ バックアップを実行して、データベースのデータ変更を継続的にバックアップします。
  • 2 日ごとに 00:00 にスナップショット バックアップを実行します。
  • スナップショット バックアップ データとログ バックアップ データを 30 日以内に保持し、30 日より古いバックアップ データをクリーンアップします。

ログのバックアップを実行する

ログ バックアップ タスクが開始されると、TiKV クラスターでログ バックアップ プロセスが実行され、データベース内のデータ変更が S3 ストレージに継続的に送信されます。ログ バックアップ タスクを開始するには、次のコマンドを実行します。

tiup br log start --task-name=pitr --pd=172.16.102.95:2379 --storage='s3://tidb-pitr-bucket/backup-data/log-backup'

ログ バックアップ タスクの実行中に、バックアップ ステータスを照会できます。

tiup br log status --task-name=pitr --pd=172.16.102.95:2379 ● Total 1 Tasks. > #1 < name: pitr status: ● NORMAL start: 2022-05-13 11:09:40.7 +0800 end: 2035-01-01 00:00:00 +0800 storage: s3://tidb-pitr-bucket/backup-data/log-backup speed(est.): 0.00 ops/s checkpoint[global]: 2022-05-13 11:31:47.2 +0800; gap=4m53s

スナップショット バックアップの実行

crontab などの自動ツールを使用して、定期的にスナップショット バックアップ タスクを実行できます。たとえば、2 日おきに 00:00 にスナップショット バックアップを実行します。

次に、2 つのスナップショット バックアップの例を示します。

  • 2022/05/14 00:00:00 にスナップショット バックアップを実行します。

    tiup br backup full --pd=172.16.102.95:2379 --storage='s3://tidb-pitr-bucket/backup-data/snapshot-20220514000000' --backupts='2022/05/14 00:00:00'
  • 2022/05/16 00:00:00 にスナップショット バックアップを実行します。

    tiup br backup full --pd=172.16.102.95:2379 --storage='s3://tidb-pitr-bucket/backup-data/snapshot-20220516000000' --backupts='2022/05/16 00:00:00'

PITR を実行する

2022/05/15 18:00:00 にデータをクエリする必要があるとします。 PITR を使用して、2022/05/14 に作成されたスナップショット バックアップと、スナップショットと 2022/05/15 18:00:00 の間のログ バックアップを復元することで、クラスターをそのタイムスタンプに復元できます。

コマンドは次のとおりです。

tiup br restore point --pd=172.16.102.95:2379 --storage='s3://tidb-pitr-bucket/backup-data/log-backup' --full-backup-storage='s3://tidb-pitr-bucket/backup-data/snapshot-20220514000000' --restored-ts '2022-05-15 18:00:00+0800' Full Restore <--------------------------------------------------------------------------------------------------------------------------------------------------------> 100.00% [2022/05/29 18:15:39.132 +08:00] [INFO] [collector.go:69] ["Full Restore success summary"] [total-ranges=12] [ranges-succeed=xxx] [ranges-failed=0] [split-region=xxx.xxxµs] [restore-ranges=xxx] [total-take=xxx.xxxs] [restore-data-size(after-compressed)=xxx.xxx] [Size=xxxx] [BackupTS={TS}] [total-kv=xxx] [total-kv-size=xxx] [average-speed=xxx] Restore Meta Files <--------------------------------------------------------------------------------------------------------------------------------------------------> 100.00% Restore KV Files <----------------------------------------------------------------------------------------------------------------------------------------------------> 100.00% [2022/05/29 18:15:39.325 +08:00] [INFO] [collector.go:69] ["restore log success summary"] [total-take=xxx.xx] [restore-from={TS}] [restore-to={TS}] [total-kv-count=xxx] [total-size=xxx]

古いデータのクリーンアップ

crontab などの自動ツールを使用して、2 日ごとに古いデータをクリーンアップできます。

たとえば、次のコマンドを実行して古いデータをクリーンアップできます。

  • 2022/05/14 00:00:00より前のスナップショットデータを削除

    rm s3://tidb-pitr-bucket/backup-data/snapshot-20220514000000
  • 2022/05/14 00:00:00より前のログバックアップデータを削除

    tiup br log truncate --until='2022-05-14 00:00:00 +0800' --storage='s3://tidb-pitr-bucket/backup-data/log-backup'

もっと詳しく知る