KB5020450：在 Azure Stack HCI 版本 21H2 和 22H2 的大型叢集案例中發生節點耗盡失敗

摘要

當您在 Azure Stack HCI 版本 21H2 或 22H2 作業系統中使用耗盡角色功能時，可能會在大型叢集案例中發生節點耗盡失敗 (例如 8 個或 8 個以上的叢集) ，因為儲存空間處於維護模式時會逾時。此問題尤其會在您更新或升級 Azure Stack HCI 作業系統時發生。

其他相關資訊

若要解決耗盡失敗逾時問題，請遵循下列步驟：

啟用維護模式或任何需要維護模式的作業，例如節點消耗或叢集感知更新之前，請先增加健康情況服務實體磁片掃描間隔。若要這麼做，請執行下列命令來變更健康情況設定：

get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000

注意在此範例中，我們會將值從 15 分鐘增加到 3 小時。不過，您應該調整此值，以確保其長度比涉及維護模式之工作流程的期望工期還要長。
等待任何進行中的掃描完成。確切工期視環境而定。 16 節點叢集可能需要四十到六十分鐘才能完成。若要確認所有現有的掃描都已完成，請檢查「SDDC 群組」擁有者節點上的健康情況服務記錄檔，並搜尋模式：

「維護模式事件解譯程式」是解譯事件種類 - 原始的「儲存空間」、EntityType「SPACES_PhysicalDisk」。

注意如果在最後一分鐘內沒有這類專案，表示所有掃描都已完成。您可以執行下列命令來擷取健康情況記錄檔：

Get-ClusterLog -Destination 。 -TimeSpan 5 -UseLocalTime -Health
執行維護模式作業或其他涉及維護模式的工作流程。
將健康情況設定還原回其原始設定。這點很重要，因為間隔很長可能會導致某些健康情況服務功能出現一些延遲，例如實體磁片相關錯誤或淘汰。若要還原健康情況設定，請執行下列命令：

get-storagesubsystem 叢集* |remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs

參考

容錯移轉叢集維護程式

了解用來描述 Microsoft 軟體更新的標準術語。

KB5020450：在 Azure Stack HCI 版本 21H2 和 22H2 的大型叢集案例中發生節點耗盡失敗

摘要

其他相關資訊

參考

需要更多協助嗎?

想要其他選項嗎?

這項資訊有幫助嗎?

感謝您的意見反應!