O serviço de cluster para de responder em um nó de cluster quando você reinicia o nó ativo

Este artigo fornece uma resolução para o problema em que o Serviço de Cluster para de responder em um Nó de Cluster quando você reinicia o Nó Ativo.

Aplica-se a: Windows Server 2012 R2
Número original do KB: 822050

Sintomas

Quando você reinicia o nó ativo de um cluster de servidor que consiste em dois ou mais nós, você experimenta todos os seguintes sintomas:

  • Se você estiver executando o Administrador de Cluster nos nós restantes, receberá a seguinte mensagem de erro ao tentar se conectar ao cluster:

    O cluster 'ClusterName' não está mais disponível.

  • Se você tentar iniciar o Administrador de Cluster, o Administrador de Cluster deixará de responder e poderá receber a seguinte mensagem de erro:

    Ocorreu um erro ao tentar abrir o cluster em 'ServerName':

    A interface é desconhecida.

    ID do erro: 1717 (000006b5).

  • Ao exibir o conteúdo de C:\Winnt\ Cluster.log, você verá informações semelhantes a:

    [FM] OnlineGroup: falha no recurso e3f4af72-6454-4199-b9af-fa6f57032a65. Status 70
    O Serviço de Clustering da Microsoft sofreu um erro fatal inesperado
    na linha 701 do módulo de origem D:\nt\private\cluster\service\fm\group.c. O código de erro era 70.

  • Quando o nó de cluster reiniciado é iniciado com êxito, o programa administrador de cluster que está em execução nos outros nós responde conforme você espera.

Motivo

Esse problema ocorrerá se você pausar um nó de um cluster de servidor e reiniciar o nó de cluster ativo. Quando o nó ativo é reiniciado, o nó pausado tenta colocar grupos de recursos online. Como esse nó está pausado, o nó não pode fazer conexões adicionais e não pode colocar o grupo de disco quorum online. O código de erro 70 corresponde à seguinte mensagem de erro:

O servidor remoto foi pausado ou está em processo de início.

Observação

Esses resultados também ocorrerão em clusters com mais de dois nós. Embora exista um nó não pausado em um estado de trabalho quando o nó ativo é reiniciado, se o nó pausado for o primeiro nó que é contatado para assumir a propriedade do disco de quorum. O nó não pausado não tem a oportunidade de arbitrar para o disco de quorum.

Resolução

Para resolve esse problema, retome o nó de cluster pausado antes de reiniciar o nó de cluster ativo.

Observação

Antes de retomar um nó de cluster pausado, primeiro você deve determinar se um nó de cluster está pausado.

  1. Clique em Iniciar, clique em Executar, digite cmd na caixa Abrir e clique em OK.

  2. No prompt de comando, digite nó de cluster e pressione ENTER. A saída é semelhante a:

    Observação

    A saída de exemplo a seguir é baseada em uma configuração de cluster de dois nós. Se você tiver mais de dois nós, os nós adicionais também aparecerão na lista.

    Status da ID do Nó de Nó
    -------------- --------- ---------------------
    CLUSTER-1 1 Pausado
    CLUSTER-2 2 Para cima

    Observação

    Se o único nó de cluster que não estiver pausado estiver no processo de reinicialização, você receberá a seguinte mensagem de erro:
    O erro do sistema 1753 ocorreu. Não há mais pontos de extremidade disponíveis no mapeador do ponto de extremidade.

  3. No prompt de comando, digite nó de cluster node_name /resume (em que node_name é o nome do nó de cluster) e pressione ENTER.

    Por exemplo, digite cluster-1 /resume e pressione ENTER. As informações são semelhantes a:

    Retomando o nó 'cluster-1'...

    Status da ID do Nó de Nó
    -------------- --------- ---------------------
    CLUSTER-1 1 Para cima