Il servizio cluster smette di rispondere a un nodo del cluster quando si riavvia il nodo attivo

Questo articolo fornisce una soluzione per il problema che il servizio cluster smette di rispondere a un nodo cluster quando si riavvia il nodo attivo.

Si applica a: Windows Server 2012 R2
Numero KB originale: 822050

Sintomi

Quando si riavvia il nodo attivo di un cluster server costituito da due o più nodi, si verificano tutti i sintomi seguenti:

  • Se si esegue l'amministratore del cluster nei nodi rimanenti, viene visualizzato il messaggio di errore seguente quando si tenta di connettersi al cluster:

    Il cluster 'ClusterName' non è più disponibile.

  • Se si tenta di avviare l'amministratore del cluster, l'amministratore del cluster smette di rispondere e potrebbe essere visualizzato il messaggio di errore seguente:

    Si è verificato un errore durante il tentativo di aprire il cluster in 'ServerName':

    L'interfaccia è sconosciuta.

    ID errore: 1717 (000006b5).

  • Quando si visualizza il contenuto di C:\Winnt\ Cluster.log, vengono visualizzate informazioni simili a:

    [FM] OnlineGroup: non riuscito nella risorsa e3f4af72-6454-4199-b9af-fa6f57032a65. Stato 70
    Il servizio Clustering Microsoft ha subito un errore irreversibile imprevisto
    alla riga 701 del modulo di origine D:\nt\private\cluster\service\fm\group.c. Il codice di errore era 70.

  • Quando il nodo del cluster riavviato viene avviato correttamente, il programma Amministratore cluster in esecuzione negli altri nodi risponde come previsto.

Causa

Questo problema si verifica se si sospende un nodo di un cluster server e quindi si riavvia il nodo del cluster attivo. Al riavvio del nodo attivo, il nodo sospeso tenta di portare online i gruppi di risorse. Poiché questo nodo è sospeso, il nodo non può stabilire connessioni aggiuntive e non può portare online il gruppo di dischi quorum. Il codice di errore 70 corrisponde al messaggio di errore seguente:

Il server remoto è stato sospeso o è in fase di avvio.

Nota

Questi risultati si verificheranno anche nei cluster che hanno più di due nodi. Anche se un nodo non sospeso esiste in uno stato di lavoro quando il nodo attivo viene riavviato, se il nodo sospeso è il primo nodo contattato per assumere la proprietà del disco quorum. Il nodo non sospeso non ha la possibilità di arbitrare per il disco quorum.

Risoluzione

Per risolvere questo problema, riprendere il nodo del cluster sospeso prima di riavviare il nodo del cluster attivo.

Nota

Prima di riprendere un nodo del cluster sospeso, è necessario determinare se un nodo del cluster è in pausa.

  1. Fare clic su Start, fare clic su Esegui, digitare cmd nella casella Apri e quindi fare clic su OK.

  2. Al prompt dei comandi digitare nodo cluster e quindi premere INVIO. L'output è simile al seguente:

    Nota

    L'output di esempio seguente si basa su una configurazione del cluster a due nodi. Se sono presenti più di due nodi, nell'elenco verranno visualizzati anche i nodi aggiuntivi.

    Stato ID nodo nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 Sospeso
    CLUSTER-2 2 Up

    Nota

    Se l'unico nodo del cluster non sospeso è in fase di riavvio, viene visualizzato il messaggio di errore seguente:
    Errore di sistema 1753. Non sono più disponibili endpoint dal mapper degli endpoint.

  3. Al prompt dei comandi digitare cluster node node_name /resume (dove node_name è il nome del nodo del cluster) e quindi premere INVIO.

    Ad esempio, digitare cluster-1 /resume del nodo cluster e quindi premere INVIO. Vengono visualizzate informazioni simili alle seguenti:

    Ripresa del nodo 'cluster-1'...

    Stato ID nodo nodo
    -------------- --------- ---------------------
    CLUSTER-1 1 Up