ログバックアップのトラブルシューティング

このドキュメントでは、ログバックアップ中の一般的な問題とその解決策をまとめています。

`br restore point`コマンドを使用してダウンストリームクラスターを復元した後、TiFlash からデータにアクセスできません。私は何をすべきか？

v6.2.0 では、PITR はクラスターの TiFlash レプリカの復元をサポートしていません。データを復元した後、次のステートメントを実行して、スキーマまたはテーブルの TiFlash レプリカを設定する必要があります。

ALTER TABLE table_name SET TIFLASH REPLICA count;

ログバックアップタスクの`status`が`ERROR`になった場合はどうすればよいですか?

ログバックアップタスク中に失敗し、再試行後に回復できない場合、タスクステータスはERRORになります。次に例を示します。

br log status --pd x.x.x.x:2379

● Total 1 Tasks.
> #1 <
                    name: task1
                  status: ○ ERROR
                   start: 2022-07-25 13:49:02.868 +0000
                     end: 2090-11-18 14:07:45.624 +0000
                 storage: s3://tmp/br-log-backup0ef49055-5198-4be3-beab-d382a2189efb/Log
             speed(est.): 0.00 ops/s
      checkpoint[global]: 2022-07-25 14:46:50.118 +0000; gap=11h31m29s
          error[store=1]: KV:LogBackup:RaftReq
error-happen-at[store=1]: 2022-07-25 14:54:44.467 +0000; gap=11h23m35s
  error-message[store=1]: retry time exceeds: and error failed to get initial snapshot: failed to get the snapshot (region_id = 94812): Error during requesting raftstore: message: "read index not ready, reason can not read index due to merge, region 94812" read_index_not_ready { reason: "can not read index due to merge" region_id: 94812 }: failed to get initial snapshot: failed to get the snapshot (region_id = 94812): Error during requesting raftstore: message: "read index not ready, reason can not read index due to merge, region 94812" read_index_not_ready { reason: "can not read index due to merge" region_id: 94812 }: failed to get initial snapshot: failed to get the snapshot (region_id = 94812): Error during requesting raftstore: message: "read index not ready, reason can not read index due to merge, region 94812" read_index_not_ready { reason: "can not read index due to merge" region_id: 94812 }

この問題を解決するには、エラーメッセージで原因を確認し、指示に従ってください。問題が解決したら、次のコマンドを実行してタスクを再開します。

br log resume --task-name=task1 --pd x.x.x.x:2379

バックアップタスクが再開されたら、 br log statusを使用してステータスを確認できます。タスクのステータスがNORMALになると、バックアップタスクは続行されます。

● Total 1 Tasks.
> #1 <
              name: task1
            status: ● NORMAL
             start: 2022-07-25 13:49:02.868 +0000
               end: 2090-11-18 14:07:45.624 +0000
           storage: s3://tmp/br-log-backup0ef49055-5198-4be3-beab-d382a2189efb/Log
       speed(est.): 15509.75 ops/s
checkpoint[global]: 2022-07-25 14:46:50.118 +0000; gap=6m28s

ノート：
この機能は、複数のバージョンのデータをバックアップします。長時間のバックアップタスクが失敗し、ステータスがERRORになると、このタスクのチェックポイントデータはsafe pointに設定され、 safe pointのデータは 24 時間以内にガベージコレクションされません。したがって、エラーが再開された後、バックアップタスクは最後のチェックポイントから続行されます。タスクが 24 時間以上失敗し、最後のチェックポイントデータがガベージコレクションされている場合、タスクを再開するとエラーが報告されます。この場合、最初にタスクを停止してから新しいバックアップタスクを開始するbr log stopコマンドしか実行できません。

`br log resume`コマンドを使用して中断されたタスクを再開するときに、エラーメッセージ`ErrBackupGCSafepointExceeded`が返された場合はどうすればよいですか?

Error: failed to check gc safePoint, checkpoint ts 433177834291200000: GC safepoint 433193092308795392 exceed TS 433177834291200000: [BR:Backup:ErrBackupGCSafepointExceeded]backup GC safepoint exceeded

ログバックアップタスクを一時停止した後、MVCC データがガベージコレクションされるのを防ぐために、一時停止中のタスクプログラムは、現在のチェックポイントをサービスセーフポイントとして自動的に設定します。これにより、24 時間以内に生成された MVCC データを確実に残すことができます。バックアップチェックポイントの MVCC データが 24 時間以上生成されている場合、チェックポイントのデータはガベージコレクションされ、バックアップタスクは再開できません。

この問題に対処するには、 br log stopを使用して現在のタスクを削除し、 br log startを使用してログバックアップタスクを作成します。同時に、後続の PITR のフルバックアップを実行できます。

PITR ログの復元中に Exchange Partition DDL を実行したときにエラーが発生した場合はどうすればよいですか?

PITR ログの復元中に次のエラーが発生します。

restore of ddl `exchange-table-partition` is not supported

v6.2.0 では、ログバックアップ機能は Exchange パーティション DDL と互換性がありません。ログのバックアップ中は、この DDL を使用しないことをお勧めします。 DDL を実行した場合は、すぐに完全バックアップを実行する必要があります。その後、PITR は完全バックアップチェックポイントの後にログデータを復元できます。

ログ バックアップのトラブルシューティング

br restore pointコマンドを使用してダウンストリーム クラスターを復元した後、TiFlash からデータにアクセスできません。私は何をすべきか？

ログ バックアップ タスクのstatusがERRORになった場合はどうすればよいですか?

br log resumeコマンドを使用して中断されたタスクを再開するときに、エラー メッセージErrBackupGCSafepointExceededが返された場合はどうすればよいですか?

PITR ログの復元中に Exchange Partition DDL を実行したときにエラーが発生した場合はどうすればよいですか?

ログバックアップのトラブルシューティング

`br restore point`コマンドを使用してダウンストリームクラスターを復元した後、TiFlash からデータにアクセスできません。私は何をすべきか？

ログバックアップタスクの`status`が`ERROR`になった場合はどうすればよいですか?

`br log resume`コマンドを使用して中断されたタスクを再開するときに、エラーメッセージ`ErrBackupGCSafepointExceeded`が返された場合はどうすればよいですか?