TiDB モニタリングに関するよくある質問

このドキュメントは、TiDB の監視に関連する FAQ をまとめたものです。

  • Prometheus 監視フレームワークの詳細については、 監視フレームワークの概要を参照してください。
  • モニタリングの主要なメトリックの詳細については、 主な指標を参照してください。

主要な指標を監視するためのより良い方法はありますか?

TiDB の監視システムは、Prometheus と Grafana で構成されています。 Grafana のダッシュボードから、TiDB のさまざまな実行中のメトリックを監視できます。これには、システム リソース、クライアント接続と SQL 操作、内部通信とリージョンスケジューリングの監視メトリックが含まれます。これらのメトリックを使用すると、データベース管理者は、システムの実行ステータス、実行中のボトルネックなどをよりよく理解できます。これらのメトリックを監視する際に、各 TiDB コンポーネントの主要なメトリックをリストします。通常、これらの一般的な指標にのみ注意を払う必要があります。詳細については、 公式文書を参照してください。

Prometheus の監視データは、デフォルトで 15 日ごとに削除されます。 2 か月に設定したり、監視データを手動で削除したりできますか?

はい。 Prometheus が開始されたマシンで起動スクリプトを見つけ、起動パラメーターを編集して、Prometheus を再起動します。

--storage.tsdb.retention="60d"

リージョンヘルス モニター

TiDB 2.0 では、リージョンの正常性は PD メトリック監視ページで監視されます。このページでは、 Region Healthの監視項目にすべてのリージョンレプリカ ステータスの統計が表示されます。 missはレプリカが不足していることを意味し、 extraは余分なレプリカが存在することを意味します。また、 Region Healthlabelによる分離レベルも示しています。 level-1は、リージョンのレプリカが最初のlabelレベルで物理的に分離されていることを意味します。 location labelが設定されていない場合、すべてのリージョンはlevel-0にあります。

Statement Count モニターでのselectsimplefullの意味は何ですか?

これはフル テーブル スキャンを意味しますが、テーブルは小さなシステム テーブルである可能性があります。

モニターにおけるQPSStatement OPSの違いは何ですか?

QPS統計は、 use databaseload databegincommitsetshowinsert 、およびselectを含むすべての SQL ステートメントに関するものです。

Statement OPSの統計は、 selectupdate 、およびinsertを含むアプリケーション関連の SQL ステートメントのみに関するものであるため、 Statement OPSの統計はアプリケーションとよりよく一致します。