Résumé
Lorsque vous utilisez la fonctionnalité de drainage des rôles dans le système d’exploitation Azure Stack HCI, version 21H2 ou 22H2, un échec de drainage de nœud peut se produire sur des scénarios de cluster volumineux (par exemple, huit clusters ou plus) en raison d’un délai d’attente lorsque le stockage est mis en mode maintenance. Ce problème se produit en particulier lorsque vous mettez à jour ou mettez à niveau le système d’exploitation Azure Stack HCI.
Plus d’informations
Pour résoudre le délai d’expiration de l’échec de drainage, procédez comme suit :
-
Avant d’activer le mode maintenance ou toute opération impliquant le mode maintenance, comme le drainage des nœuds ou la mise à jour adaptée au cluster, augmentez d’abord l’intervalle d’analyse des disques physiques du service d’intégrité. Pour ce faire, modifiez le paramètre d’intégrité en exécutant la commande suivante :
get-storagesubsystem Cluster* | set-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs -Value 10800000
Remarque Dans cet exemple, nous augmentons la valeur de quinze minutes à trois heures. Toutefois, vous devez ajuster cette valeur pour vous assurer qu’elle est plus longue que la durée attendue du workflow qui implique le mode maintenance.
-
Attendez la fin des analyses en cours. La durée exacte dépend de l’environnement. La fin de l’opération peut prendre quarante à soixante minutes sur un cluster à 16 nœuds. Pour vérifier que toutes les analyses existantes sont terminées, case activée le journal du service d’intégrité sur le nœud propriétaire du « groupe SDDC » et recherchez le modèle :
'Maintenance Mode Event Interpreter' interprète le type d’événement - Origine 'Storage', EntityType 'SPACES_PhysicalDisk'.
Remarque S’il n’y a pas d’entrée de ce type dans la dernière minute, cela signifie que toutes les analyses sont terminées. Le journal d’intégrité peut être récupéré en exécutant la commande suivante :
Get-ClusterLog -Destination . -TimeSpan 5 -UseLocalTime -Health
-
Exécutez une opération en mode maintenance ou un autre workflow qui implique le mode maintenance.
-
Rétablissez le paramètre d’intégrité à son paramètre d’origine. Cela est important, car un intervalle long peut entraîner un certain retard dans certaines fonctionnalités du service d’intégrité, telles que des erreurs liées au disque physique ou la mise hors service. Pour rétablir le paramètre d’intégrité, exécutez la commande suivante :
get-storagesubsystem Cluster* | remove-storagehealthsetting -name System.Storage.PhysicalDisk.CheckPeriodMs
Références
Procédures de maintenance du cluster de basculement
Découvrez la terminologie standard utilisée pour décrire les mises à jour logicielles Microsoft.