Cluster Service deja de responder en un nodo de clúster al reiniciar el nodo activo

En este artículo se proporciona una solución para el problema que Cluster Service deja de responder en un nodo de clúster al reiniciar el nodo activo.

Se aplica a: Windows Server 2012 R2
Número de KB original: 822050

Síntomas

Al reiniciar el nodo activo de un clúster de servidor que consta de dos o más nodos, experimenta todos los síntomas siguientes:

  • Si ejecuta el administrador de clústeres en los nodos restantes, recibirá el siguiente mensaje de error al intentar conectarse al clúster:

    El clúster "ClusterName" ya no está disponible.

  • Si intenta iniciar el administrador de clústeres, el administrador de clústeres deja de responder y puede recibir el siguiente mensaje de error:

    Error al intentar abrir el clúster en "ServerName":

    La interfaz es desconocida.

    Identificador de error: 1717 (000006b5).

  • Al ver el contenido de C:\Winnt\ Cluster.log, verá información similar a la siguiente:

    [FM] OnlineGroup: error en el recurso e3f4af72-6454-4199-b9af-fa6f57032a65. Estado 70
    Microsoft Clustering Service sufrió un error irrecuperable inesperado.
    en la línea 701 del módulo de origen D:\nt\private\cluster\service\fm\group.c. El código de error era 70.

  • Cuando el nodo de clúster reiniciado se inicia correctamente, el programa administrador de clústeres que se ejecuta en los demás nodos responde como espera.

Causa

Este problema se produce si pausa un nodo de un clúster de servidor y, a continuación, reinicia el nodo de clúster activo. Cuando se reinicia el nodo activo, el nodo en pausa intenta poner en línea los grupos de recursos. Dado que este nodo está en pausa, el nodo no puede realizar conexiones adicionales y no puede poner en línea el grupo de discos quorum. El código de error 70 corresponde al siguiente mensaje de error:

El servidor remoto se ha pausado o está en proceso de inicio.

Nota:

Estos resultados también se producirán en clústeres que tienen más de dos nodos. Aunque un nodo no en pausa existe en un estado de trabajo cuando se reinicia el nodo activo, si el nodo en pausa es el primer nodo con el que se contacta para tomar posesión del disco de cuórum. El nodo no en pausa no tiene la oportunidad de arbitrar para el disco de cuórum.

Solución

Para resolver este problema, reanude el nodo de clúster en pausa antes de reiniciar el nodo de clúster activo.

Nota:

Antes de reanudar un nodo de clúster en pausa, primero debe determinar si un nodo de clúster está en pausa.

  1. Haga clic en Inicio, en Ejecutar, escriba cmd en el cuadro Abrir y, a continuación, haga clic en Aceptar.

  2. En el símbolo del sistema, escriba nodo de clúster y presione ENTRAR. La salida es similar a:

    Nota:

    La siguiente salida de ejemplo se basa en una configuración de clúster de dos nodos. Si tiene más de dos nodos, los nodos adicionales también aparecerán en la lista.

    Estado del identificador de nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 En pausa
    CLUSTER-2 2 Up

    Nota:

    Si el único nodo de clúster que no está en pausa está en proceso de reinicio, recibirá el siguiente mensaje de error:
    Error del sistema 1753. No hay más puntos de conexión disponibles en el asignador de puntos de conexión.

  3. En el símbolo del sistema, escriba el nodo de clúster node_name /resume (donde node_name es el nombre del nodo del clúster) y, a continuación, presione ENTRAR.

    Por ejemplo, escriba cluster-1 /resume del nodo de clúster y presione ENTRAR. La información aparece de forma similar a:

    Reanudando el nodo "cluster-1"...

    Estado del identificador de nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 Up