vSAN健全性チェックで"統計情報に影響するすべてのホスト"が記録される
vSAN健全性チェックでvSANパフォーマンスサービスの"統計情報に影響するすべてのホスト"のエラーが記録されていたので、その対処方法についてです。
このチェックの目的はVMware KB2144400に記載されています。
Q:[パフォーマンス サービス - 統計情報に影響するすべてのホスト] チェックでは何を行いますか。
A:このチェックでは、現在同じネットワーク パーティションの一部であるすべてのホストがコレクションの統計に影響していることを確認します。同じネットワーク パーティションにないホストは、確認しません。一般的なネットワーク健全性チェックを使用して、全体的なクラスタの健全性のこの側面を評価します。このチェックは、vSAN パフォーマンス サービスがホストと通信し、統計を取得できることを確認するために使用されます。
Q:エラー状態とは、どのような状況を意味しますか。A:このチェックが黄色の場合は、一部のホストがパフォーマンス統計に影響していないことを意味します。
この問題は様々な要因で発生するため、本問題を解決するための一連のトラブルシューティングを行います。
1.全vSAN Hostのvsanmgmtdのサービスを再起動
[root@esxi01:~] /etc/init.d/vsanmgmtd restart
watchdog-vsanperfsvc: Terminating watchdog process with PID 2101508
vsanperfsvc started
※この作業は稼働中のVMには影響ありません。
2.vCenter Server Applianceのvmware-vsan-healthサービスを再起動
root@vc [ ~ ]# service-control --stop vmware-vsan-health
Operation not cancellable. Please wait for it to finish...
Performing stop operation on service vsan-health...
Successfully stopped service vsan-health
root@vc [ ~ ]# service-control --start vmware-vsan-health
Operation not cancellable. Please wait for it to finish...
Performing start operation on service vsan-health...
Successfully started service vsan-health
3.vSphere Web ClientからvSANパフォーマンスサービスをOff/Onを実施
(※過去のvSANパフォーマンス統計データが削除されます)
vSANクラスタ > 設定 > 健全性とパフォーマンス > オフにする
4.全vSAN HostのvSAN Storage Providerの証明書の確認
vCenter Server > 設定 > ストレージプロバイダ > vSAN Provider "ESXi Hostname" > 証明書情報
上記で確認した所、"問題のないホスト"は証明書がPSCから発行されている事に対し、"問題のあるホスト"はvCenterから発行されている事に気が付きました。
※本環境は外部PSCなので、vCenterとPSCが独立して存在しており、本来はPSCから証明書が発行される事が正しい挙動になります。
問題のあるホスト
問題のないホスト
解決策としては、問題のあるホストの証明書を再発行します。
"問題のあるESXiホスト" > 設定 > 証明書 > 更新
※証明書の再発行をすると、ESXiホストのHAエージェントが再起動しますので、クラスタでHAを有効化している場合は、予期せずVMがフェールオーバーする可能性があります。
証明書の再発行後、vSAN健全性テストを実施して、パスする事を確認します。
同様の事象が発生した場合は、参考にして頂けると幸いです。
関連KB
https://kb.vmware.com/s/article/2150570
https://kb.vmware.com/s/article/52567
以上です。