KB5020450: falhas de drenagem de nó ocorrem em grandes cenários de cluster no Azure Stack HCI, versão 21H2 e 22H2

Resumo

Quando você usa o recurso de funções de drenagem no Azure Stack HCI, versão 21H2 ou sistema operacional 22H2, uma falha de drenagem de nó pode ocorrer em cenários grandes de cluster (como oito ou mais clusters) devido a um tempo limite quando o armazenamento é colocado em modo de manutenção. Esse problema ocorre especialmente quando você atualiza ou atualiza o sistema operacional HCI do Azure Stack.

Mais informações

Para resolve o tempo limite de falha de drenagem, siga estas etapas:

Antes de habilitar o modo de manutenção ou qualquer operação que envolva o modo de manutenção, como drenagem de nó ou Atualização Consciente do Cluster, primeiro aumente o intervalo de verificação de discos físicos do serviço de integridade. Para fazer isso, altere a configuração de integridade executando o seguinte comando:

Cluster get-storagesubsystem* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000

Observação Neste exemplo, aumentamos o valor de quinze minutos para três horas. No entanto, você deve ajustar esse valor para garantir que ele seja maior do que a duração esperada do fluxo de trabalho que envolve o modo de manutenção.
Aguarde até que as verificações em andamento sejam concluídas. A duração exata depende do ambiente. Pode levar de 40 a 60 minutos em um cluster de 16 nós para ser concluído. Para verificar se todas as verificações existentes foram concluídas, marcar o log do serviço de integridade no nó proprietário do "Grupo SDDC" e pesquise o padrão:

'Gerenciador de Eventos do Modo de Manutenção' está interpretando Tipo de Evento – Origem 'Armazenamento', EntityType 'SPACES_PhysicalDisk'.

Observação Se não houver essa entrada no último minuto, significa que todos os exames foram concluídos. O log de integridade pode ser recuperado executando o seguinte comando:

Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
Execute uma operação de modo de manutenção ou outro fluxo de trabalho que envolve o modo de manutenção.
Reverta a configuração de integridade de volta à configuração original. Isso é importante, pois um longo intervalo pode potencialmente causar algum atraso em determinadas funcionalidades do serviço de saúde, como erros relacionados ao disco físico ou aposentadoria. Para reverter a configuração de integridade, execute o seguinte comando:

Cluster get-storagesubsystem* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs

Referências

Procedimentos de manutenção de cluster de failover

Saiba mais sobre a terminologia padrão ousada para descrever as atualizações de software da Microsoft.

KB5020450: falhas de drenagem de nó ocorrem em grandes cenários de cluster no Azure Stack HCI, versão 21H2 e 22H2

Resumo

Mais informações

Referências

Precisa de mais ajuda?

Quer mais opções

Essas informações foram úteis?

Agradecemos seus comentários!