Usługa klastrowania przestaje odpowiadać na węźle klastra po ponownym uruchomieniu węzła aktywnego


Symptomy


Po ponownym uruchomieniu węzła aktywnego klastra serwerów, który składa się z dwóch lub większej liczby węzłów, występują następujące symptomy:
  • Jeśli korzystasz z administratora klastrów na pozostałych węzłach, podczas próby nawiązania połączenia z klastrem zostanie wyświetlony następujący komunikat o błędzie:
    Klaster "ClusterName" nie jest już dostępny.
  • Jeśli spróbujesz uruchomić administratora klastrów, Administrator klastrów przestanie odpowiadać i może zostać wyświetlony następujący komunikat o błędzie:
    Wystąpił błąd podczas próby otwarcia klastra pod adresem "nazwa_serwera": interfejs jest nieznany. Identyfikator błędu: 1717 (000006b5).
  • Po wyświetleniu zawartości C:\Winnt\Cluster. log są wyświetlane informacje podobne do następujących:
    [FM] OnlineGroup: Failed on resource e3f4af72-6454-4199-b9af-fa6f57032a65. Status 70Microsoft Clustering Service suffered an unexpected fatal errorat line 701 of source module D:\nt\private\cluster\service\fm\group.c. The error code was 70. 
  • Po pomyślnym uruchomieniu ponownie uruchomionego węzła klastra program Administratora klastrów uruchomiony na innych węzłach odpowiada zgodnie z oczekiwaniami.

Przyczyna


Ten problem występuje w przypadku wstrzymania jednego węzła klastra serwerów, a następnie ponownego uruchomienia aktywnego węzła klastra. Gdy aktywny węzeł zostanie ponownie uruchomiony, wstrzymany węzeł usiłuje przełączyć grupy zasobów w tryb online. Ponieważ ten węzeł jest wstrzymany, węzeł nie może nawiązywania dodatkowych połączeń i nie może przełączyć grupy dyskowej kworum do trybu online. Kod błędu 70 odpowiada następującemu komunikatowi o błędzie:
Serwer zdalny został wstrzymany lub jest w trakcie uruchamiania.
Uwaga Te wyniki będą również występować w klastrach, które mają więcej niż dwa węzły. Mimo że węzeł, który nie jest wstrzymany, istnieje w stanie roboczym po ponownym uruchomieniu węzła aktywnego, jeśli węzeł wstrzymany jest pierwszym węzłem, z którym nawiązano kontakt, przejęcie na własność dysku kworum. Węzeł kworum nie ma możliwości rozstrzygania dla węzła bez wstrzymania.

Rozwiązanie


Aby rozwiązać ten problem, Wznów wstrzymany węzeł klastra przed ponownym uruchomieniem aktywnego węzła klastra.Uwaga Przed wznowieniem wstrzymanego węzła klastra należy najpierw sprawdzić, czy węzeł klastra jest wstrzymany.
  1. Kliknij przycisk Start, kliknij polecenie Uruchom, wpisz ciąg cmd w polu Otwórz, a następnie kliknij przycisk OK.
  2. W wierszu polecenia wpisz polecenie cluster node, a następnie naciśnij klawisz ENTER. Zostaną wyświetlone dane wyjściowe podobne do poniższych.Uwaga Poniższe przykładowe dane wyjściowe są oparte na dwuwęzłowej konfiguracji klastra. Jeśli masz więcej niż dwa węzły, dodatkowe węzły również zostaną wyświetlone na liście.
    Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 PausedCLUSTER-2            2 Up 
    Uwaga Jeśli jedynym węzłem klastra, który nie jest wstrzymany, jest proces ponownego uruchamiania, zostanie wyświetlony następujący komunikat o błędzie:
    Wystąpił błąd systemowy 1753. Nie ma już dostępnych punktów końcowych z funkcji mapowania punktów końcowych.
  3. W wierszu polecenia wpisz cluster node NODE_NAME /resume (gdzie NODE_NAME jest nazwą węzła klastra), a następnie naciśnij klawisz ENTER. Na przykład wpisz klaster Node Cluster -1 /Resume, a następnie naciśnij klawisz ENTER. Zostaną wyświetlone informacje podobne do następujących:
    Resuming node 'cluster-1'...Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 Up