Resumo
Quando você usa o recurso de funções de drenagem no Azure Stack HCI, versão 21H2 ou sistema operacional 22H2, uma falha de drenagem de nó pode ocorrer em cenários grandes de cluster (como oito ou mais clusters) devido a um tempo limite quando o armazenamento é colocado em modo de manutenção. Esse problema ocorre especialmente quando você atualiza ou atualiza o sistema operacional HCI do Azure Stack.
Mais informações
Para resolve o tempo limite de falha de drenagem, siga estas etapas:
-
Antes de habilitar o modo de manutenção ou qualquer operação que envolva o modo de manutenção, como drenagem de nó ou Atualização Consciente do Cluster, primeiro aumente o intervalo de verificação de discos físicos do serviço de integridade. Para fazer isso, altere a configuração de integridade executando o seguinte comando:
Cluster get-storagesubsystem* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000
Observação Neste exemplo, aumentamos o valor de quinze minutos para três horas. No entanto, você deve ajustar esse valor para garantir que ele seja maior do que a duração esperada do fluxo de trabalho que envolve o modo de manutenção.
-
Aguarde até que as verificações em andamento sejam concluídas. A duração exata depende do ambiente. Pode levar de 40 a 60 minutos em um cluster de 16 nós para ser concluído. Para verificar se todas as verificações existentes foram concluídas, marcar o log do serviço de integridade no nó proprietário do "Grupo SDDC" e pesquise o padrão:
'Gerenciador de Eventos do Modo de Manutenção' está interpretando Tipo de Evento – Origem 'Armazenamento', EntityType 'SPACES_PhysicalDisk'.
Observação Se não houver essa entrada no último minuto, significa que todos os exames foram concluídos. O log de integridade pode ser recuperado executando o seguinte comando:
Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
-
Execute uma operação de modo de manutenção ou outro fluxo de trabalho que envolve o modo de manutenção.
-
Reverta a configuração de integridade de volta à configuração original. Isso é importante, pois um longo intervalo pode potencialmente causar algum atraso em determinadas funcionalidades do serviço de saúde, como erros relacionados ao disco físico ou aposentadoria. Para reverter a configuração de integridade, execute o seguinte comando:
Cluster get-storagesubsystem* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs
Referências
Procedimentos de manutenção de cluster de failover
Saiba mais sobre a terminologia padrão ousada para descrever as atualizações de software da Microsoft.