Устранение неполадки кластера с кодом события 1135

Какие функции выполняет это руководство?

Помогает диагностировать и устранить неполадку с кодом события 1135, которая может возникать при запуске службы кластеров в среде отказоустойчивого кластера.

Кто может использовать это средство?

Администраторы, устраняющие проблему с кодом события 1135 для службы кластеров.

Как работает это средство?

Вы ознакомитесь с рядом инструкций, применимых в вашей ситуации.

Примерное время выполнения.

30–60 минут.

Начальная страница

Код события 1135 указывает на то, что из членства в активном отказоустойчивом кластере были удалены один или несколько узлов кластера. Проблема может сопровождаться такими симптомами: 

Проверка системы и тесты сети — это первый шаг в устранении неполадок, который мы рекомендуем предпринять. Это позволит убедиться, что проблема не связана с конфигурацией.


Проверьте наличие рекомендуемых обновлений

Служба кластеров — это базовый компонент программного обеспечения, который контролирует все аспекты, связанные с работой отказоустойчивого кластера, и управляет базой данных конфигурации последнего. При появлении кода 1135 мы рекомендуем установить исправления из указанных ниже статей базы знаний, а затем перезагрузить все узлы кластера, чтобы убедиться, что проблема устранена.

Убедитесь, что служба кластеров запущена на всех узлах

Выполните команду для используемой операционной системы Windows, чтобы убедиться, что служба кластеров доступна и работает без сбоев.

Для кластера Windows Server 2008 R2:

в командной строке с повышенными правами выполните команду: cluster.exe node /stat

Для кластеров Windows Server 2012 и Windows Server 2012 R2:

выполните команду PS: cluster node /status


Служба кластеров работает непрерывно и доступна на всех узлах?

Начальная страница

Код события 1135 указывает на то, что из членства в активном отказоустойчивом кластере были удалены один или несколько узлов кластера. Проблема может сопровождаться такими симптомами: 

Проверка системы и тесты сети — это первый шаг в устранении неполадок, который мы рекомендуем предпринять. Это позволит убедиться, что проблема не связана с конфигурацией.


Проверьте наличие рекомендуемых обновлений

Служба кластеров — это базовый компонент программного обеспечения, который контролирует все аспекты, связанные с работой отказоустойчивого кластера, и управляет базой данных конфигурации последнего. При появлении кода 1135 мы рекомендуем установить исправления из указанных ниже статей базы знаний, а затем перезагрузить все узлы кластера, чтобы убедиться, что проблема устранена.

Убедитесь, что служба кластеров запущена на всех узлах

Выполните команду для используемой операционной системы Windows, чтобы убедиться, что служба кластеров доступна и работает без сбоев.

Для кластера Windows Server 2008 R2:

в командной строке с повышенными правами выполните команду: cluster.exe node /stat

Для кластеров Windows Server 2012 и Windows Server 2012 R2:

выполните команду PS: cluster node /status


Служба кластеров работает непрерывно и доступна на всех узлах?

Решение для устранения сбоев в работе службы кластеров

Если в работе службы кластеров происходит сбой, устраните неполадку, воспользовавшись материалами по этой ссылке: http://blogs.technet.com/b/askcore/archive/2010/06/08/windows-server-2008-and-2008r2-failover-cluster-startup-switches.aspx


Устранена ли проблема?

Несколько сценариев для события с кодом 1135

Внимательно изучите журналы системных событий для всех узлов кластера. Просмотрите события с кодом 1135 для узлов и скопируйте все экземпляры события. Это упростит работу с ними.

Event ID 1135Cluster node ‘NODE A’ was removed from the active failover cluster membership. The Cluster service on this node may have stopped. This could also be due to the node having lost communication with other active nodes in the failover cluster. Run the Validate a Configuration wizard to check your network configuration. If the condition persists, check for hardware or software errors related to the network adapters on this node. Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.
Существует три типичных сценария.

СЦЕНАРИЙ A:

при просмотре всех событий вы видите, что все узлы кластера указывают на потерю связи с узлом NODE A.

3878_image11
 
3878_image12
 

Возможно, в системных журналах для узла NODE A показаны события для всех остальных узлов в кластере.

СЦЕНАРИЙ B:

при просмотре событий на узлах вы видите, что кластер будто разделен на два сайта. При этом узлы Node A, Node B и Node C находятся на сайте SITE 1, а узлы Node D и Node E — на сайте SITE 2.

3878_image13
 

На узлах Node A, Node B и Node C отображаются события, связанные с подключением к узлам Node D и Node E. Соответственно, на узлах Node D и Node E показаны события с сообщением о потере связи с узлами Node A, Node B и Node C.

3878_image14
 

СЦЕНАРИЙ C:

При просмотре событий на узлах вы видите, что их имена и сами сведения отображаются без какой-либо последовательности. Кластер словно разделен на два сайта. При этом узлы Node A, Node B и Node C находятся на сайте SITE 1, а узлы Node D и Node E — на сайте SITE 2.

  • На узле Node A показаны события для узлов Node B, Node D и Node E.
  • На узле Node B показаны события для узлов Node C, Node D и Node E.
  • На узле Node C показаны события для узлов Node A, Node B и Node E.
  • На узле Node D показаны события для узлов Node A, Node C и Node E.
  • На узле Node E показаны события для узлов Node B, Node C и Node D.
  • Любые другие комбинации. 

3878_image16
 


Выберите сценарий

Решение для сценария A

Вероятно, проблема возникла в тот момент, когда связь с узлом NODE A была потеряна из-за перезагрузки сети или по иным причинам.

При этом необходимо проверить конфигурацию сети и устранить проблемы со связью. Просмотрите проблемы, относящиеся к узлу Node A.


Устранена ли проблема?

Решение для сценария B

При этом сценарии неполадка обусловлена сбоем связи между сайтами. Мы рекомендуем проверить соединение между сайтами. Если вы используете подключение глобальных сетей, для его проверки необходимо обратиться к поставщику услуг Интернета.


Устранена ли проблема?

Решение для сценария C

Такие события возможны, если сетевые каналы между узлами перегружены, а служебные сообщения кластера приходят с задержкой. Это служит для кластера сигналом о потере связи между узлами и лишении их членства в кластере.


Устранена ли проблема?

Обзор сетей кластеров

Далее в рамках этого руководства мы рекомендуем проверить сети кластеров по трем пунктам.


Выберите один из пунктов ниже.

Исключение из диапазона проверки антивирусной программы

Исключите из диапазона поиска вирусов, запущенного для служб кластеров, такие расположения в файловой системе:

  • путь к общей папке следящего сервера;
  • папку %Systemroot%\Cluster.
Настройте компонент поиска вирусов в реальном времени в вашей антивирусной программе, чтобы исключить такие каталоги и файлы:
  • каталог конфигурации виртуальной машины по умолчанию (C:\ProgramData\Microsoft\Windows\Hyper-V);
  • пользовательские каталоги конфигурации виртуальной машины;
  • каталог виртуального жесткого диска по умолчанию (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks);
  • пользовательские каталоги виртуального жесткого диска;
  • пользовательские каталоги репликации данных при использовании реплики Hyper-V;
  • каталоги моментальных снимков;
  • mms.exe (примечание: этот файл необходимо добавить в список исключений для процесса поиска вирусов антивирусной программой);
  • vmwp.exe (примечание: этот файл необходимо добавить в список исключений для процесса поиска вирусов антивирусной программой).
Кроме того, если вы используете динамическую миграцию вместе с общими томами кластера, из диапазона поиска необходимо удалить путь CSV "C:\Clusterstorage" и все его подкаталоги.
Если вы пытаетесь устранить сбой при переходе на другой ресурс или общие проблемы со службами кластеров, а на вашем компьютере установлена антивирусная программа, временно удалите ее или уточните у производителя, работает ли это программное обеспечение со службами кластеров. Чаще всего простого отключения антивирусного программного обеспечения недостаточно. Даже если вы отключите антивирусную программу, драйвер фильтра будет загружаться при перезапуске компьютера.

Устранена ли проблема?
Проверка конфигурации сетевого порта в брандмауэре

Служба кластеров контролирует операции кластера серверов и управляет его базой данных. Кластер — это набор отдельных компьютеров, которые работают как одна система. Для руководителей, программистов и пользователей кластер выглядит единой системой. Программное обеспечение распределяет данные между узлами кластера. В случае сбоя одного из таких узлов находящиеся в его ведении службы и данные предоставляются другими узлами. Когда восстанавливается или добавляется узел, программное обеспечение кластера перемещает на него часть данных.

Имя системной службы: ClusSvc

 Приложение Протокол Порты
 Служба кластеровUDP  3343
 Служба кластеров TCP 3343 (этот порт требуется во время операции объединения узлов.)
 RPC TCP 135
 Администратор кластера UDP 137
 Kerberos UDP\TCP 464 *
 SMB TCP 445
 Распределяемые случайным образом UDP-порты верхнего диапазона ** UDPСлучайный номер порта в диапазоне от 1024 до 65535
 Случайный номер порта в диапазоне от 49152 до 65535 *** 

Примечание.

Для успешной проверки на отказоустойчивых кластерах Windows Server 2008 или более поздних версий следует разрешить входящий и исходящий трафик для протоколов ICMP4 и ICMP6. 

* Дополнительные сведения см. в статье "Сбой создания отказоустойчивого кластера для Windows Server 2012 с кодом ошибки 0xc000005e" http://support.microsoft.com/kb/2830510.

** Дополнительные сведения о настройке этих портов см. в разделе "Удаленный вызов процедур и модель DCOM" раздела "Ссылки" в статье KB832017.

*** Этот диапазон используется в Windows Server 2012, Windows 8, Windows Server 2008 R2, Windows 7, Windows Server 2008 и Windows Vista.

Кроме того, необходимо проверить конфигурацию сетевого порта в брандмауэре, выполнив команду ниже. Пример. Эта команда помогает определить состояние порта 3343 применительно к отказоустойчивому кластеру: доступен или открыт.

netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose


Устранена ли проблема?

Формирование отчета о проверке кластера для просмотра возможных ошибок или предупреждений

Средство проверки кластера запускает набор тестов, чтобы проверить, совместимы ли ваши оборудование и настройки с отказоустойчивой кластеризацией.

Следуйте инструкциям ниже.

  1. Запустите формирование отчета о проверке кластера, чтобы просмотреть возможные ошибки и предупреждения. Посетите этот блог, чтобы получить дополнительные сведения.
    3878_image4
     
  2. Убедитесь, что в отчете нет предупреждений или сообщений об ошибках, связанных с сетями: http://technet.microsoft.com/en-us/library/cc771323.aspx
    3878_image5
     
    3878_image6
     


Выберите один из пунктов ниже.

Проверка порядка привязки к сети

Этот тест позволяет определить порядок привязки сетей к адаптерам на каждом узле.

Вкладка "Адаптеры и привязки" содержит список подключений в определенном порядке. Именно в такой последовательности выполняется подключение к сетевым службам. Она отображает очередность, в которой общие вызовы или пакеты протокола TCP/IP отправляются для подключения.

Чтобы изменить порядок привязки сетевых адаптеров:

  1. Нажмите кнопку Пуск, выберите пункт Выполнить, введите ncpa.cpl и нажмите кнопку ОК. Доступные соединения будут показаны в разделе ЛВС или высокоскоростной Интернет в окне Сетевые подключения.
  2. Перейдите в меню Дополнительно, выберите пункт Дополнительные параметры, а затем откройте вкладку Адаптеры и привязки.
  3. В области Подключения выберите то, которое требуется переместить в начало списка. Для этого используйте кнопки со стрелками. Как правило, подключение, которое обеспечивает связь с сетью (подключение к домену, маршруты к другим сетям и т. д.), указывается в начале списка как первая привязка.

Узлы кластера размещаются в нескольких системах. Приоритет сети влияет на клиент DNS для исходящих сетевых подключений. Сетевые адаптеры, используемые для клиентских подключений, должны иметь наивысший приоритет привязки. Немаршрутизируемые сети могут иметь низкий приоритет. В Windows Server 2012 и Windows Server2012 R2 адаптер драйвера сети кластеров (NETFT.SYS) автоматически получает самый низкий приоритет в списке привязки.


Устранена ли проблема?

Проверка сетевого взаимодействия

Причиной неполадки с кластером может быть задержка в сети. Возможно, сетевые пакеты не затерялись между узлами, а просто не успевают попасть на них до истечения времени ожидания.

С помощью этого теста можно проверить, является ли допустимой задержка взаимодействия между серверами во всех сетях.

Пример. При проверке сетевого взаимодействия вы можете увидеть сообщения, которые указывают на проблемы, связанные с задержкой в сети.

Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).Either address 10.0.0.96 is not reachable from 192.168.0.2 or the ping latency is greater than the maximum allowed 2000 ms This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networksEither address 192.168.0.2 is not reachable from 10.0.0.96 or the ping latency is greater than the maximum allowed 2000 ms This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks
Для мультисайтового кластера может потребоваться увеличить время ожидания.

По вопросам подключения к глобальной сети обращайтесь к поставщику услуг Интернета.


У вас возникли дополнительные вопросы?


Сетевые пакеты затерялись между узлами
  1. Проверка наличия потери пакетов с помощью системного монитора
    Если пакет затерялся где-то между узлами, подтвердить соединение не удастся. Эту проблему можно обнаружить с помощью счетчика системного монитора Network Interface\Packets Received Discarded (Сетевой интерфейс/количество полученных или отклоненных пакетов). После добавления этого счетчика проверьте среднее, минимальное и максимальное значения. Если любое из них выше нуля, необходимо настроить размер буфера приема для адаптера.
    3878_image17
     
    Если вы сталкиваетесь с потерей пакетов на платформе виртуализации VmWare, см. раздел Кластер, установленный на платформе виртуализации VmWare.
  2. Обновление драйверов сетевой карты
    Эта проблема может возникать из-за устаревших драйверов сетевой карты, компонентов интеграции, инструментов виртуальных машин или неисправных сетевых адаптеров.
    Если сетевые пакеты затерялись между узлами на физических машинах, необходимо обновить драйвер сетевого адаптера. Старые или устаревшие драйверы сетевой карты и/или встроенное ПО.
    Иногда подтвердить соединение не удается из-за неправильной настройки сетевой карты или переключения.

Устранена ли проблема?




Кластер, установленный на платформе виртуализации VmWare

Если вы работаете в среде VMware, необходимо исключить проблемы, связанные с адаптером VMware.

Неполадка может возникать, если пакеты потерялись в связи с резкими скачками трафика.

Убедитесь, что для трафика не используется фильтр (например, почтовый). Исключив такую возможность, постепенно увеличьте количество буферов в операционной системе на виртуальной машине и проверьте результаты.

Чтобы уменьшить количество сбоев при резких скачках трафика:

  1. Откройте окно "Выполнить", нажав клавиши Windows+R.
  2. Введите devmgmt.msc и нажмите клавишу ВВОД.
  3. Разверните раздел Сетевые адаптеры.
  4. Щелкните правой кнопкой мыши пункт vmxnet3 и выберите команду "Свойства".
  5. Откройте вкладку Дополнительно.
  6. Выберите параметр Small Rx Buffers и увеличьте значение. Значение по умолчанию: 512. Максимальное значение: 8192.
  7. Выберите параметр Rx Ring #1 и увеличьте значение. Значение по умолчанию: 1024. Максимальное значение: 4096.

Просмотрите разделы ниже, чтобы исключить другие проблемы с адаптером VMware при условии работы со средой VMware:

http://blogs.technet.com/b/askcore/archive/2013/06/03/nodes-being-removed-from-failover-cluster-membership-on-vmware-esx.aspx

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2039495

Перегрузка сети

Перегрузка сети также может вызывать проблемы с сетевым подключением.

Убедитесь, что сеть настроена согласно рекомендациям корпорации Майкрософт и поставщика услуги:

Проверка конфигурации сетевых ресурсов отказоустойчивого кластера Windows http://blogs.technet.com/b/askcore/archive/2014/02/20/configuring-windows-failover-cluster-networks.aspx

Проверка конфигурации сети

Если вам все еще не удалось устранить проблему, убедитесь, что в графическом пользовательском интерфейсе кластера нет секционированной сети или для подтверждения соединения не включено объединение сетевых карт.


С какой проблемой вы столкнулись?

Секционированная сеть в графическом пользовательском интерфейсе кластера

Обнаружив секционированную сеть в графическом пользовательском интерфейсе кластера, вы можете решить проблему, воспользовавшись этой статьей блога: http://blogs.technet.com/b/askcore/archive/2011/08/08/partitioned-cluster-networks.aspx


Устранена ли проблема?

Обновление драйверов сетевой карты

Эта проблема может возникать из-за драйверов сетевой карты или неисправных сетевых адаптеров.

Если сетевые пакеты затерялись между узлами на физических машинах, необходимо обновить драйвер сетевого адаптера, старые или устаревшие драйверы сетевой карты и/или встроенное ПО.

Иногда подтвердить соединение не удается из-за неправильной настройки сетевой карты или переключения.


Устранена ли проблема?

Проверка конфигурации сети

Если вам все еще не удалось устранить проблему, убедитесь, что в графическом пользовательском интерфейсе кластера нет секционированной сети или для подтверждения соединения не включено объединение сетевых карт.


С какой проблемой вы столкнулись?

Для подтверждения соединения включено объединение сетевых карт

Если для подтверждения соединения включено объединение сетевых карт, проверьте исправность ПО для поддержки групп согласно рекомендациям поставщика.


Устранена ли проблема?

Поздравляем!

Ваша проблема успешно решена.

Приносим свои извинения

Похоже, вашу проблему невозможно устранить с помощью данного интерактивного руководства. Чтобы получить дополнительную помощь в устранении неполадки, посетите наш форум поддержки TechNet или обратитесь в службу поддержки Майкрософт.

Перегрузка сети

Перегрузка сети также может вызывать проблемы с сетевым подключением.

Убедитесь, что сеть настроена согласно рекомендациям корпорации Майкрософт и поставщика услуги:

проверка конфигурации сетевых ресурсов отказоустойчивого кластера Windows http://blogs.technet.com/b/askcore/archive/2014/02/20/configuring-windows-failover-cluster-networks.aspx

Проверка конфигурации сети

Если вам все еще не удалось устранить проблему, убедитесь, что в графическом пользовательском интерфейсе кластера нет секционированной сети или для подтверждения соединения не включено объединение сетевых карт.


С какой проблемой вы столкнулись?

Свойства

Номер статьи: 10158 — последний просмотр: 6 окт. 2016 г. — редакция: 5

Отзывы и предложения