Сводка
При использовании функции очистки ролей в операционной системе Azure Stack HCI версии 21H2 или 22H2 может произойти сбой стока узлов в сценариях с большим кластером (например, в восьми или более кластерах) из-за истечения времени ожидания при переводе хранилища в режим обслуживания. Эта проблема особенно возникает при обновлении или обновлении операционной системы Azure Stack HCI.
Дополнительные сведения
Чтобы устранить истечение времени ожидания сбоя стока, выполните следующие действия.
-
Прежде чем включить режим обслуживания или любую операцию, включающую режим обслуживания, например очистку узла или обновление с поддержкой кластера, сначала увеличьте интервал сканирования физических дисков службы работоспособности. Для этого измените параметр работоспособности, выполнив следующую команду:
Get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 108000000
Примечание В этом примере мы увеличиваем значение с пятнадцати минут до трех часов. Однако следует настроить это значение, чтобы убедиться, что оно больше ожидаемой продолжительности рабочего процесса, включающего режим обслуживания.
-
Дождитесь завершения всех текущих проверок. Точная длительность зависит от среды. Завершение работы кластера с 16 узлами может занять от сорока до шестидесяти минут. Чтобы убедиться, что все существующие проверки завершены, проверка журнал службы работоспособности на узле владельца группы SDDC и найдите шаблон:
Интерпретатор событий режима обслуживания интерпретирует тип события : источник "Хранилище", EntityType "SPACES_PhysicalDisk".
Примечание Если такая запись отсутствует в течение последней минуты, это означает, что все проверки завершены. Журнал работоспособности можно получить, выполнив следующую команду:
Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
-
Запустите операцию в режиме обслуживания или другой рабочий процесс, который включает режим обслуживания.
-
Возврат к исходному параметру работоспособности. Это важно, так как длительный интервал может привести к некоторой задержке некоторых функциональных возможностей службы работоспособности, таких как ошибки, связанные с физическим диском, или прекращение использования. Чтобы отменить изменения параметр работоспособности, выполните следующую команду:
Get-storagesubsystem Cluster* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs
Ссылки
Процедуры обслуживания отказоустойчивого кластера
Сведения о стандартной терминологии, используемой для описания обновлений программного обеспечения Майкрософт.