KB5020450: сбои стока узлов происходят в сценариях больших кластеров в Azure Stack HCI версий 21H2 и 22H2

Сводка

При использовании функции очистки ролей в операционной системе Azure Stack HCI версии 21H2 или 22H2 может произойти сбой стока узлов в сценариях с большим кластером (например, в восьми или более кластерах) из-за истечения времени ожидания при переводе хранилища в режим обслуживания. Эта проблема особенно возникает при обновлении или обновлении операционной системы Azure Stack HCI.

Дополнительные сведения

Чтобы устранить истечение времени ожидания сбоя стока, выполните следующие действия.

Прежде чем включить режим обслуживания или любую операцию, включающую режим обслуживания, например очистку узла или обновление с поддержкой кластера, сначала увеличьте интервал сканирования физических дисков службы работоспособности. Для этого измените параметр работоспособности, выполнив следующую команду:

Get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 108000000

Примечание В этом примере мы увеличиваем значение с пятнадцати минут до трех часов. Однако следует настроить это значение, чтобы убедиться, что оно больше ожидаемой продолжительности рабочего процесса, включающего режим обслуживания.
Дождитесь завершения всех текущих проверок. Точная длительность зависит от среды. Завершение работы кластера с 16 узлами может занять от сорока до шестидесяти минут. Чтобы убедиться, что все существующие проверки завершены, проверка журнал службы работоспособности на узле владельца группы SDDC и найдите шаблон:

Интерпретатор событий режима обслуживания интерпретирует тип события : источник "Хранилище", EntityType "SPACES_PhysicalDisk".

Примечание Если такая запись отсутствует в течение последней минуты, это означает, что все проверки завершены. Журнал работоспособности можно получить, выполнив следующую команду:

Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
Запустите операцию в режиме обслуживания или другой рабочий процесс, который включает режим обслуживания.
Возврат к исходному параметру работоспособности. Это важно, так как длительный интервал может привести к некоторой задержке некоторых функциональных возможностей службы работоспособности, таких как ошибки, связанные с физическим диском, или прекращение использования. Чтобы отменить изменения параметр работоспособности, выполните следующую команду:

Get-storagesubsystem Cluster* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs

Ссылки

Процедуры обслуживания отказоустойчивого кластера

Сведения о стандартной терминологии, используемой для описания обновлений программного обеспечения Майкрософт.

KB5020450: сбои стока узлов происходят в сценариях больших кластеров в Azure Stack HCI версий 21H2 и 22H2

Сводка

Дополнительные сведения

Ссылки

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Были ли сведения полезными?

Спасибо за ваш отзыв!