摘要
當您在 Azure Stack HCI 版本 21H2 或 22H2 作業系統中使用耗盡角色功能時,可能會在大型叢集案例中發生節點耗盡失敗 (例如 8 個或 8 個以上的叢集) ,因為儲存空間處於維護模式時會逾時。 此問題尤其會在您更新或升級 Azure Stack HCI 作業系統時發生。
其他相關資訊
若要解決耗盡失敗逾時問題,請遵循下列步驟:
-
啟用維護模式或任何需要維護模式的作業,例如節點消耗或叢集感知更新之前,請先增加健康情況服務實體磁片掃描間隔。 若要這麼做,請執行下列命令來變更健康情況設定:
get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000
注意 在此範例中,我們會將值從 15 分鐘增加到 3 小時。 不過,您應該調整此值,以確保其長度比涉及維護模式之工作流程的期望工期還要長。
-
等待任何進行中的掃描完成。 確切工期視環境而定。 16 節點叢集可能需要四十到六十分鐘才能完成。 若要確認所有現有的掃描都已完成,請檢查「SDDC 群組」擁有者節點上的健康情況服務記錄檔,並搜尋模式:
「維護模式事件解譯程式」是解譯事件種類 - 原始的「儲存空間」、EntityType「SPACES_PhysicalDisk」。
注意 如果在最後一分鐘內沒有這類專案,表示所有掃描都已完成。 您可以執行下列命令來擷取健康情況記錄檔:
Get-ClusterLog -Destination 。 -TimeSpan 5 -UseLocalTime -Health
-
執行維護模式作業或其他涉及維護模式的工作流程。
-
將健康情況設定還原回其原始設定。 這點很重要,因為間隔很長可能會導致某些健康情況服務功能出現一些延遲,例如實體磁片相關錯誤或淘汰。 若要還原健康情況設定,請執行下列命令:
get-storagesubsystem 叢集* |remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs
參考
了解用來描述 Microsoft 軟體更新的標準術語。