KB5020450: Los errores de drenaje de nodos se producen en grandes escenarios de clústeres en Azure Stack HCI, versión 21H2 y 22H2

Resumen

Al usar la característica de funciones de drenaje en el sistema operativo Azure Stack HCI, versión 21H2 o 22H2, puede producirse un error de drenaje de nodos en grandes escenarios de clúster (como ocho o más clústeres) debido a un tiempo de espera cuando el almacenamiento se pone en modo de mantenimiento. Este problema se produce especialmente al actualizar el sistema operativo Azure Stack HCI.

Más información

Para resolver el tiempo de salida del error de drenaje, siga estos pasos:

Antes de habilitar el modo de mantenimiento o cualquier operación que implique un modo de mantenimiento como el drenaje de nodos o la actualización del clúster, primero aumente el intervalo de análisis de discos físicos del servicio de mantenimiento. Para ello, ejecute el siguiente comando para cambiar la configuración de estado:

get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000

Nota En este ejemplo, aumentamos el valor de quince minutos a tres horas. Sin embargo, debe ajustar este valor para asegurarse de que es más largo que la duración esperada del flujo de trabajo que implica el modo de mantenimiento.
Espera hasta que finalicen los exámenes en curso. La duración exacta depende del entorno. Puede tardar entre cuarenta y sesenta minutos en terminar un clúster de 16 nodos. Para comprobar que todos los exámenes existentes han terminado, compruebe el registro del servicio de mantenimiento en el nodo propietario del "grupo SDDC" y busque el patrón:

El intérprete de eventos del modo de mantenimiento interpreta el tipo de evento - Origin 'Storage', EntityType 'SPACES_PhysicalDisk'.

Nota Si no hay tal entrada en el último minuto, significa que todos los exámenes han terminado. Para recuperar el registro de estado, ejecute el siguiente comando:

Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
Ejecute una operación de modo de mantenimiento u otro flujo de trabajo que implique el modo de mantenimiento.
Revierta la configuración de estado a su configuración original. Esto es importante, ya que un intervalo largo podría provocar algún retraso en cierta funcionalidad del servicio de mantenimiento, como errores relacionados con el disco físico o la retirada. Para revertir la configuración de estado, ejecute el siguiente comando:

get-storagesubsystem Cluster* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs

Referencias

Procedimientos de mantenimiento del clúster de conmutación por error

Obtenga información sobre la terminología estándar que se usa para describir las actualizaciones de software de Microsoft.

KB5020450: Los errores de drenaje de nodos se producen en grandes escenarios de clústeres en Azure Stack HCI, versión 21H2 y 22H2

Resumen

Más información

Referencias

¿Necesita más ayuda?

¿Quiere más opciones?

¿Le ha sido útil esta información?

¡Gracias por sus comentarios!