Клъстерната услуга спира да отговаря на клъстерен възел при рестартиране на активния възел


Симптоми


Когато рестартирате активния възел на сървърен клъстер, който се състои от два или повече възела, ще се сблъскате със следните симптоми:
  • Ако изпълнявате администратор на клъстери в оставащите възли, получавате следното съобщение за грешка, когато се опитвате да се свържете с клъстера:
    Клъстерът "ClusterName" вече не е наличен.
  • Ако се опитате да стартирате администратора на клъстери, администраторът на клъстера спира да отговаря и е възможно да получите следното съобщение за грешка:
    Възникна грешка при опит за отваряне на клъстера в "ServerName": интерфейсът е неизвестен. ИД на грешка: 1717 (000006b5).
  • Когато видите съдържанието на C:\Winnt\клъстър. log, виждате информация, подобна на следната:
    [FM] OnlineGroup: Failed on resource e3f4af72-6454-4199-b9af-fa6f57032a65. Status 70Microsoft Clustering Service suffered an unexpected fatal errorat line 701 of source module D:\nt\private\cluster\service\fm\group.c. The error code was 70. 
  • Когато рестартираният клъстерен възел се стартира успешно, програмата за управление на клъстери, която се изпълнява на другите възли, отговаря на очакванията ви.

Причина


Този проблем възниква, ако спирате временно един възел на сървърен клъстер и след това рестартирате активния възел за клъстери. Когато активният възел се рестартира, в пауза възелът се опитва да събере ресурсните групи онлайн. Тъй като този възел е на пауза, възелът не може да направи допълнителни връзки и не може да доведе до онлайн събранието. Код на грешка 70 съответства на следното съобщение за грешка:
Отдалеченият сървър е на пауза или е в процес на стартиране.
Забележка Тези резултати ще възникнат и в клъстери, които имат повече от два възела. Въпреки че един неспирал възел съществува в работно състояние, когато активният възел бъде рестартиран, ако в спрения възел е първият възел, към който се свързва, за да придобие собствеността върху дисковия кворум. Възелът, който не е на пауза, няма възможност да бъде арбитър за кворумния диск.

Решение


За да отстраните този проблем, възстановете временно спрения клъстерен възел, преди да рестартирате активния възел за клъстери.Забележка Преди да възобновите даден групов възел, най-напред трябва да определите дали даден клъстерен възел е на пауза.
  1. Щракнете върху Старт, щракнете върху изпълнение, въведете CMD в полето Отвори и след това щракнете върху OK.
  2. В командната подкана въведете клъстерен възели след това натиснете клавиша ENTER. Появява се резултат, който е подобен на този по-долу.Забележка Следващият примерен резултат е базиран на конфигурация на клъстери с два възела. Ако имате повече от две възела, в списъка ще се появят и допълнителни възли.
    Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 PausedCLUSTER-2            2 Up 
    Забележка Ако единственият клъстерен възел, който не е на пауза, е в процес на рестартиране, получавате следното съобщение за грешка:
    Възникна грешка в системата 1753. Няма повече крайни точки, налични от Mapper за крайна точка.
  3. В командната подкана въведете клъстърен възел node_name /възобновяване (където node_name е името на клъстерния възел), след което натиснете клавиша ENTER. Например въведете клъстерен възел клъстър-1 /възобновяванеи след това натиснете клавиша ENTER. Появява се информация, подобна на следната:
    Resuming node 'cluster-1'...Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 Up