Applies ToAzure Stack HCI, version 21H2 Azure Stack HCI, version 22H2

摘要

當您在 Azure Stack HCI 版本 21H2 或 22H2 作業系統中使用耗盡角色功能時,可能會在大型叢集案例中發生節點耗盡失敗 (例如 8 個或 8 個以上的叢集) ,因為儲存空間處於維護模式時會逾時。 此問題尤其會在您更新或升級 Azure Stack HCI 作業系統時發生。

其他相關資訊

若要解決耗盡失敗逾時問題,請遵循下列步驟: 

  1. 啟用維護模式或任何需要維護模式的作業,例如節點消耗或叢集感知更新之前,請先增加健康情況服務實體磁片掃描間隔。 若要這麼做,請執行下列命令來變更健康情況設定:

    get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000

    注意 在此範例中,我們會將值從 15 分鐘增加到 3 小時。 不過,您應該調整此值,以確保其長度比涉及維護模式之工作流程的期望工期還要長。

  2. 等待任何進行中的掃描完成。 確切工期視環境而定。 16 節點叢集可能需要四十到六十分鐘才能完成。 若要確認所有現有的掃描都已完成,請檢查「SDDC 群組」擁有者節點上的健康情況服務記錄檔,並搜尋模式:

    「維護模式事件解譯程式」是解譯事件種類 - 原始的「儲存空間」、EntityType「SPACES_PhysicalDisk」。

    注意 如果在最後一分鐘內沒有這類專案,表示所有掃描都已完成。 您可以執行下列命令來擷取健康情況記錄檔:

    Get-ClusterLog -Destination 。 -TimeSpan 5 -UseLocalTime -Health

  3. 執行維護模式作業或其他涉及維護模式的工作流程。

  4. 將健康情況設定還原回其原始設定。 這點很重要,因為間隔很長可能會導致某些健康情況服務功能出現一些延遲,例如實體磁片相關錯誤或淘汰。 若要還原健康情況設定,請執行下列命令:

    get-storagesubsystem 叢集* |remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs

參考

容錯移轉叢集維護程式

了解用來描述 Microsoft 軟體更新的標準術語

Need more help?

Want more options?

探索訂閱權益、瀏覽訓練課程、瞭解如何保護您的裝置等等。

社群可協助您詢問並回答問題、提供意見反應,以及聆聽來自具有豐富知識的專家意見。