El servicio de Cluster Server deja de responder en un nodo de clúster cuando reinicia el nodo activo


Síntomas


Cuando reinicia el nodo activo de un clúster de servidor que consta de dos o más nodos, experimenta todos los síntomas siguientes:
  • Si ejecuta el administrador de clústeres en el resto de los nodos, recibirá el siguiente mensaje de error al intentar conectarse al clúster:
    El clúster 'nombreDeClúster' ya no está disponible.
  • Si intenta iniciar el administrador de clústeres, el administrador de clústeres deja de responder y es posible que reciba el siguiente mensaje de error:
    Error al intentar abrir el clúster en 'nombreServidor': la interfaz es desconocida. IDENTIFICADOR de error: 1717 (000006b5).
  • Cuando vea el contenido de C:\Winnt\cluster. log, verá información similar a la siguiente:
    [FM] OnlineGroup: Failed on resource e3f4af72-6454-4199-b9af-fa6f57032a65. Status 70Microsoft Clustering Service suffered an unexpected fatal errorat line 701 of source module D:\nt\private\cluster\service\fm\group.c. The error code was 70. 
  • Cuando el nodo de clúster reiniciado se inicia correctamente, el programa Administrador de clústeres que se ejecuta en el resto de los nodos responde según lo esperado.

Causa


Este problema se produce si pausa un nodo de un clúster de servidor y, a continuación, reinicia el nodo de clúster activo. Cuando se reinicia el nodo activo, el nodo pausado intenta poner los grupos de recursos en línea. Puesto que este nodo está pausado, el nodo no puede establecer conexiones adicionales y no puede conectar el grupo de discos de quórum. El código de error 70 corresponde al siguiente mensaje de error:
El servidor remoto ha sido pausado o está en proceso de iniciarse.
Nota Estos resultados también se producirán en clústeres que tengan más de dos nodos. Aunque exista un nodo no pausado en un estado de funcionamiento cuando se reinicie el nodo activo, si el nodo pausado es el primer nodo con el que se Contacta para tomar posesión del disco de quórum. El nodo no pausado no tiene la oportunidad de arbitrar el disco de quórum.

Resolución


Para resolver este problema, reanude el nodo de clúster pausado antes de reiniciar el nodo de clúster activo.Nota Antes de reanudar un nodo de clúster pausado, primero debe determinar si un nodo de clúster está en pausa.
  1. Haga clic en Inicio y en Ejecutar, escriba cmd en el cuadro Abrir y, después, haga clic en Aceptar.
  2. En el símbolo del sistema, escriba cluster nodey, a continuación, presione Entrar. Aparece un resultado similar al siguiente:Nota La siguiente salida de ejemplo se basa en una configuración de clúster de dos nodos. Si tiene más de dos nodos, los nodos adicionales también aparecerán en la lista.
    Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 PausedCLUSTER-2            2 Up 
    Nota Si el único nodo de clúster que no se ha pausado está en proceso de reiniciarse, recibirá el siguiente mensaje de error:
    Error del sistema 1753. No hay más puntos de conexión disponibles desde el asignador de puntos finales.
  3. En el símbolo del sistema, escriba cluster node node_name /resume (donde node_name es el nombre del nodo de clúster) y, a continuación, presione Entrar. Por ejemplo, escriba cluster node cluster-1 /resumey, a continuación, presione Entrar. La información es similar a la siguiente:
    Resuming node 'cluster-1'...Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 Up