TiDB モニタリングに関するよくある質問

このドキュメントは、TiDB の監視に関連する FAQ をまとめたものです。

Prometheus 監視フレームワークの詳細については、監視フレームワークの概要を参照してください。
モニタリングの主要なメトリックの詳細については、主な指標を参照してください。

主要な指標を監視するためのより良い方法はありますか?

TiDB の監視システムは、Prometheus と Grafana で構成されています。 Grafana のダッシュボードから、TiDB のさまざまな実行中のメトリックを監視できます。これには、システムリソース、クライアント接続と SQL 操作、内部通信とリージョンスケジューリングの監視メトリックが含まれます。これらのメトリックを使用すると、データベース管理者は、システムの実行ステータス、実行中のボトルネックなどをよりよく理解できます。これらのメトリックを監視する際に、各 TiDB コンポーネントの主要なメトリックをリストします。通常、これらの一般的な指標にのみ注意を払う必要があります。詳細については、公式文書を参照してください。

Prometheus の監視データは、デフォルトで 15 日ごとに削除されます。 2 か月に設定したり、監視データを手動で削除したりできますか?

はい。 Prometheus が開始されたマシンで起動スクリプトを見つけ、起動パラメーターを編集して、Prometheus を再起動します。

--storage.tsdb.retention="60d"

リージョンヘルスモニター

TiDB 2.0 では、リージョンの正常性は PD メトリック監視ページで監視されます。このページでは、 Region Healthの監視項目にすべてのリージョンレプリカステータスの統計が表示されます。 missはレプリカが不足していることを意味し、 extraは余分なレプリカが存在することを意味します。また、 Region Healthはlabelによる分離レベルも示しています。 level-1は、リージョンのレプリカが最初のlabelレベルで物理的に分離されていることを意味します。 location labelが設定されていない場合、すべてのリージョンはlevel-0にあります。

Statement Count モニターでの`selectsimplefull`の意味は何ですか?

これはフルテーブルスキャンを意味しますが、テーブルは小さなシステムテーブルである可能性があります。

モニターにおける`QPS`と`Statement OPS`の違いは何ですか?

QPS統計は、 use database 、 load data 、 begin 、 commit 、 set 、 show 、 insert 、およびselectを含むすべての SQL ステートメントに関するものです。

Statement OPSの統計は、 select 、 update 、およびinsertを含むアプリケーション関連の SQL ステートメントのみに関するものであるため、 Statement OPSの統計はアプリケーションとよりよく一致します。

TiDB モニタリングに関するよくある質問

主要な指標を監視するためのより良い方法はありますか?

Prometheus の監視データは、デフォルトで 15 日ごとに削除されます。 2 か月に設定したり、監視データを手動で削除したりできますか?

リージョンヘルス モニター

Statement Count モニターでのselectsimplefullの意味は何ですか?

モニターにおけるQPSとStatement OPSの違いは何ですか?

リージョンヘルスモニター

Statement Count モニターでの`selectsimplefull`の意味は何ですか?

モニターにおける`QPS`と`Statement OPS`の違いは何ですか?