Le service de cluster cesse de répondre sur un nœud de cluster lorsque vous redémarrez le nœud actif

Cet article fournit une résolution du problème lié au fait que le service de cluster cesse de répondre sur un nœud de cluster lorsque vous redémarrez le nœud actif.

S’applique à : Windows Server 2012 R2
Numéro de la base de connaissances d’origine : 822050

Symptômes

Lorsque vous redémarrez le nœud actif d’un cluster de serveurs composé de deux nœuds ou plus, vous rencontrez tous les symptômes suivants :

  • Si vous exécutez l’administrateur de cluster sur les nœuds restants, le message d’erreur suivant s’affiche lorsque vous essayez de vous connecter au cluster :

    Le cluster 'ClusterName' n’est plus disponible.

  • Si vous essayez de démarrer l’administrateur de cluster, l’administrateur de cluster cesse de répondre et le message d’erreur suivant peut s’afficher :

    Une erreur s’est produite lors de la tentative d’ouverture du cluster à l’emplacement « ServerName » :

    L’interface est inconnue.

    ID d’erreur : 1717 (000006b5).

  • Lorsque vous affichez le contenu de C :\Winnt\ Cluster.log, vous voyez des informations similaires à :

    [FM] OnlineGroup : Échec sur la ressource e3f4af72-6454-4199-b9af-fa6f57032a65. État 70
    Le service de clustering Microsoft a subi une erreur irrécupérable inattendue
    à la ligne 701 du module source D :\nt\private\cluster\service\fm\group.c. Le code d’erreur était 70.

  • Lorsque le nœud de cluster redémarré démarre correctement, le programme Administrateur de cluster qui s’exécute sur les autres nœuds répond comme prévu.

Cause

Ce problème se produit si vous suspendez un nœud d’un cluster de serveurs, puis redémarrez le nœud de cluster actif. Lorsque le nœud actif redémarre, le nœud en pause tente de mettre les groupes de ressources en ligne. Étant donné que ce nœud est suspendu, le nœud ne peut pas établir de connexions supplémentaires et ne peut pas mettre le groupe de disques quorum en ligne. Le code d’erreur 70 correspond au message d’erreur suivant :

Le serveur distant a été suspendu ou est en cours de démarrage.

Remarque

Ces résultats se produisent également dans les clusters qui ont plus de deux nœuds. Même si un nœud non suspendu existe dans un état de fonctionnement lorsque le nœud actif est redémarré, si le nœud en pause est le premier nœud contacté pour prendre possession du disque de quorum. Le nœud non suspendu n’a pas la possibilité d’arbitrer pour le disque de quorum.

Résolution

Pour résoudre ce problème, reprenez le nœud de cluster en pause avant de redémarrer le nœud de cluster actif.

Remarque

Avant de reprendre un nœud de cluster en pause, vous devez d’abord déterminer si un nœud de cluster est suspendu.

  1. Cliquez sur Démarrer, sur Exécuter, tapez cmd dans la zone Ouvrir , puis cliquez sur OK.

  2. À l’invite de commandes, tapez nœud de cluster, puis appuyez sur Entrée. La sortie est similaire à ce qui suit :

    Remarque

    L’exemple de sortie suivant est basé sur une configuration de cluster à deux nœuds. Si vous avez plus de deux nœuds, les nœuds supplémentaires apparaissent également dans la liste.

    État de l’ID de nœud du nœud
    -------------- --------- ---------------------
    CLUSTER-1 1 Suspendu
    CLUSTER-2 2 Up

    Remarque

    Si le seul nœud de cluster qui n’est pas suspendu est en cours de redémarrage, le message d’erreur suivant s’affiche :
    L’erreur système 1753 s’est produite. Il n’y a plus de points de terminaison disponibles à partir du mappeur de point de terminaison.

  3. À l’invite de commandes, tapez nœud de cluster node_name /resume ( où node_name est le nom du nœud de cluster), puis appuyez sur Entrée.

    Par exemple, tapez cluster node cluster-1 /resume, puis appuyez sur Entrée. Des informations similaires à celles-ci s’affichent :

    Reprise du nœud « cluster-1 »...

    État de l’ID de nœud du nœud
    -------------- --------- ---------------------
    CLUSTER-1 1 Up