TiDB モニタリングに関するよくある質問
このドキュメントは、TiDB の監視に関連する FAQ をまとめたものです。
- Prometheus 監視フレームワークの詳細については、 監視フレームワークの概要を参照してください。
- モニタリングの主要なメトリックの詳細については、 主な指標を参照してください。
主要な指標を監視するためのより良い方法はありますか?
TiDB の監視システムは、Prometheus と Grafana で構成されています。 Grafana のダッシュボードから、TiDB のさまざまな実行中のメトリックを監視できます。これには、システム リソース、クライアント接続と SQL 操作、内部通信とリージョンスケジューリングの監視メトリックが含まれます。これらのメトリックを使用すると、データベース管理者は、システムの実行ステータス、実行中のボトルネックなどをよりよく理解できます。これらのメトリックを監視する際に、各 TiDB コンポーネントの主要なメトリックをリストします。通常、これらの一般的な指標にのみ注意を払う必要があります。詳細については、 公式文書を参照してください。
Prometheus の監視データは、デフォルトで 15 日ごとに削除されます。 2 か月に設定したり、監視データを手動で削除したりできますか?
はい。 Prometheus が開始されたマシンで起動スクリプトを見つけ、起動パラメーターを編集して、Prometheus を再起動します。
--storage.tsdb.retention="60d"
リージョンヘルス モニター
TiDB 2.0 では、リージョンの正常性は PD メトリック監視ページで監視されます。このページでは、 Region Health
の監視項目にすべてのリージョンレプリカ ステータスの統計が表示されます。 miss
はレプリカが不足していることを意味し、 extra
は余分なレプリカが存在することを意味します。また、 Region Health
はlabel
による分離レベルも示しています。 level-1
は、リージョンのレプリカが最初のlabel
レベルで物理的に分離されていることを意味します。 location label
が設定されていない場合、すべてのリージョンはlevel-0
にあります。
Statement Count モニターでのselectsimplefull
の意味は何ですか?
これはフル テーブル スキャンを意味しますが、テーブルは小さなシステム テーブルである可能性があります。
モニターにおけるQPS
とStatement OPS
の違いは何ですか?
QPS
統計は、 use database
、 load data
、 begin
、 commit
、 set
、 show
、 insert
、およびselect
を含むすべての SQL ステートメントに関するものです。
Statement OPS
の統計は、 select
、 update
、およびinsert
を含むアプリケーション関連の SQL ステートメントのみに関するものであるため、 Statement OPS
の統計はアプリケーションとよりよく一致します。