Сбой службы кластеров на всех узлах после выключения узла кластера, который владеет ресурсом кворума диска в Windows Server 2008 SP2

Применимо к: Windows Server 2008 Datacenter without Hyper-VWindows Server 2008 Enterprise without Hyper-VWindows Server 2008 Datacenter

Симптомы


Рассмотрим следующий сценарий:
  • Настройка отказоустойчивого кластера на некоторых компьютерах под управлением Windows Server 2008 Пакет обновления 2 (SP2).
  • Можно использовать Нет большинства: только диск режим кворума в кластере.
  • Узел, владеющий кластерную группу с ресурсом диска кворума пытается остановить службу кластеров.
В этом случае сбоя кластера происходит на всех узлах.

Кроме того в журнале системы регистрируется экземпляр событие с кодом 7024, похожее на следующее:

Причина


Эта проблема возникает из-за взаимоблокировки, которая приводит к истечения срока действия таймера. Этот таймер завершает работу службы кластера.

Таймер, который завершает работу службы кластеров будет установлен, если ресурс кворума диск находится в автономном режиме на узле. При завершении работы службы кластера на узле кластера, который владеет ресурсом кворума диска вводит состояние взаимоблокировки. Однако службы кластеров на всех узлах ошибкой, если диск кворума не подключен на другом узле после истечения срока действия таймера. Таким образом при дисковый ресурс кворума не подключен, после истечения срока действия таймера сбой службы кластеров на всех узлах.

Примечание. Этот таймер, который завершает работу службы кластеров, называется «таймер смерти» в журнал кластера.

Решение


Сведения об исправлении

Существует исправление от корпорации Майкрософт. Однако данное исправление предназначено для устранения только проблемы, описанной в этой статье. Применяйте это исправление только в тех случаях, когда наблюдается проблема, описанная в данной статье. Это исправление может проходить дополнительное тестирование. Таким образом если вы не подвержены серьезно этой проблеме, рекомендуется дождаться следующего пакета обновления, содержащего это исправление.

Если исправление доступно для скачивания, имеется раздел "Пакет исправлений доступен для скачивания" в верхней части этой статьи базы знаний. Если этот раздел не отображается, обратитесь в службу поддержки для получения исправления.

Примечание. Если наблюдаются другие проблемы или необходимо устранить неполадки, вам может понадобиться создать отдельный запрос на обслуживание. Стандартная оплата за поддержку будет взиматься только за дополнительные вопросы и проблемы, которые не соответствуют требованиям конкретного исправления. Чтобы получить полный список телефонов поддержки и обслуживания клиентов корпорации Майкрософт или создать отдельный запрос на обслуживание, посетите следующий веб-сайт корпорации Майкрософт:Примечание. В форме "Пакет исправлений доступен для скачивания" отображаются языки, для которых доступно исправление. Если нужный язык не отображается, значит исправление для данного языка отсутствует.

Предварительные условия

Для установки этого исправления необходимо наличие Windows Server 2008 с пакетом обновления 2 на компьютере. Кроме того компонента отказоустойчивого кластера необходимо установить на компьютере.

Необходимость перезагрузки

После установки исправления компьютер необходимо перезагрузить.

Сведения о замене исправлений

Это исправление не заменяет ранее выпущенные исправления.

Сведения о файлах

Глобальная версия этого исправления устанавливает файлы с атрибутами, указанными в приведенных ниже таблицах. Дата и время для файлов указаны в формате UTC. Дата и время для файлов на локальном компьютере отображаются в местном времени с вашим текущим смещением летнего времени (DST). Кроме того, при выполнении определенных операций с файлами, даты и время могут изменяться.
Примечания к сведениям о файле Windows Server 2008
Важно. Исправления для Windows Server 2008 и Windows Vista исправления включены в те же пакеты. Однако только «Windows Vista» отображается на странице запрос исправления. Для получения пакета исправлений, который применяется к одной или обеих операционных систем, установите исправления, перечисленные в разделе «Windows Vista» на странице. Всегда смотрите раздел "Информация в данной статье относится к следующим продуктам" статьи для определения фактических операционных систем, к которым применяется каждое исправление.
  • Файлы, относящиеся к определенному продукту, этапу разработки (RTM, SPn) и направлению поддержки (LDR, GDR) можно определить путем проверки номера версий файлов, как показано в следующей таблице.
    ВерсияПродуктSR_LevelНаправление поддержки
    6.0.600
    2.
    22 xxx
    Windows Vista и Windows Server 2008SP2LDR
  • Файлы МАНИФЕСТА (.manifest) и MUM (.mum), устанавливаемые для каждой среды, указаны отдельно в разделе Дополнительные сведения о файлах» для системы Windows Server 2008». MUM файлы и файлы МАНИФЕСТА и связанные файлы каталога безопасности (.cat), очень важны для поддержания состояния обновляемого компонента. Файлы каталога безопасности, для которых не перечислены атрибуты, подписаны цифровой подписью корпорации Майкрософт.
Для всех поддерживаемых версий Windows Server 2008 для систем на базе x86
Имя файлаВерсия файлаРазмер файлаДатаВремяПлатформа
Clussvc.exe6.0.6002.223482,338,30425-Feb-201013:24x86
Для всех поддерживаемых версий Windows Server 2008 для систем на базе x64
Имя файлаВерсия файлаРазмер файлаДатаВремяПлатформа
Clussvc.exe6.0.6002.223483,864,57625-Feb-201013:35x64
Для всех поддерживаемых IA-64-разрядных версий Windows Server 2008
Имя файлаВерсия файлаРазмер файлаДатаВремяПлатформа
Clussvc.exe6.0.6002.223486,469,63225-Feb-201013:31IA-64

Временное решение


Временное решение для Windows Server 2008

Чтобы обойти эту проблему, увеличьте значение параметра QuorumArbitrationTimeMax . Чтобы задать значение для QuorumArbitrationTimeMax параметр явно, в командной строке введите следующую команду и нажмите клавишу ВВОД:
cluster /prop quorumarbitrationtimemax=90
Примечание. Значение этого параметра зависит от окружения. Таким образом значение необходимо скорректировать на большее значение. Если увеличить значение до 120, и эта проблема по-прежнему возникает, так как этот метод обхода уязвимости не может решить проблему установки исправления.

Статус


Корпорация Майкрософт подтверждает, что это проблема продуктов Майкрософт, перечисленных в разделе "Относится к".

Дополнительные сведения


Дополнительные сведения о команде кластера посетите следующий веб-узел корпорации Майкрософт:Дополнительные сведения о режимах кворума посетите следующий веб-узел корпорации Майкрософт:Дополнительные сведения о настройке кворума в отказоустойчивом кластере, посетите следующий веб-узел корпорации Майкрософт:Для получения дополнительных сведений о терминологии обновлений программного обеспечения щелкните следующий номер статьи базы знаний Майкрософт:

Описание 824684 Стандартные термины, используемые при описании обновлений программных продуктов Майкрософт

Сведения о дополнительных файлах

Сведения о дополнительных файлах для Windows Server 2008

Дополнительные файлы для всех поддерживаемых версий Windows Server 2008 для систем на базе x86
Имя файлаUpdate.mum
Версия файлаНеприменимо
Размер файла2,224
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаX86_5f10021605c22a9c2444dae29a471933_31bf3856ad364e35_6.0.6002.22348_none_296c6306fc1968c1.manifest
Версия файлаНеприменимо
Размер файла711
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаX86_microsoft-windows-f..overcluster-clussvc_31bf3856ad364e35_6.0.6002.22348_none_bc0e841eb7e8eecd.manifest
Версия файлаНеприменимо
Размер файла15,117
Дата (UTC)25-Feb-2010
Время (UTC)17:47
ПлатформаНеприменимо
Дополнительные файлы для всех поддерживаемых 64-разрядных версий Windows Server 2008
Имя файлаAmd64_7a8adc3f13c2bde700ff5aed2d0235fb_31bf3856ad364e35_6.0.6002.22348_none_8289eabf326ba975.manifest
Версия файлаНеприменимо
Размер файла1,072
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаAmd64_microsoft-windows-f..overcluster-clussvc_31bf3856ad364e35_6.0.6002.22348_none_182d1fa270466003.manifest
Версия файлаНеприменимо
Размер файла15,155
Дата (UTC)25-Feb-2010
Время (UTC)17:24
ПлатформаНеприменимо
Имя файлаUpdate.mum
Версия файлаНеприменимо
Размер файла2,240
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаWow64_microsoft-windows-f..overcluster-clussvc_31bf3856ad364e35_6.0.6002.22348_none_2281c9f4a4a721fe.manifest
Версия файлаНеприменимо
Размер файла4,510
Дата (UTC)25-Feb-2010
Время (UTC)17:37
ПлатформаНеприменимо
Дополнительные файлы для всех поддерживаемых версий Windows Server 2008 на базе процессоров IA-64
Имя файлаIa64_e9f0268b80c5f42a6ec292cb99479202_31bf3856ad364e35_6.0.6002.22348_none_175041df87868371.manifest
Версия файлаНеприменимо
Размер файла1,070
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаIa64_microsoft-windows-f..overcluster-clussvc_31bf3856ad364e35_6.0.6002.22348_none_bc102814b7e6f7c9.manifest
Версия файлаНеприменимо
Размер файла15,136
Дата (UTC)25-Feb-2010
Время (UTC)17:06
ПлатформаНеприменимо
Имя файлаUpdate.mum
Версия файлаНеприменимо
Размер файла1,581
Дата (UTC)26-Feb-2010
Время (UTC)01:08
ПлатформаНеприменимо
Имя файлаWow64_microsoft-windows-f..overcluster-clussvc_31bf3856ad364e35_6.0.6002.22348_none_2281c9f4a4a721fe.manifest
Версия файлаНеприменимо
Размер файла4,510
Дата (UTC)25-Feb-2010
Время (UTC)17:37
ПлатформаНеприменимо

Сведения о ведении журнала

Ниже приведен пример журнала кластера при возникновении проблемы.
00000264.00000938::2009/08/04-19:03:00.727 INFO  [QUORUM] Node 3: quorum is arbitrated by node 1
00000264.00000938::2009/08/04-19:06:10.379 INFO [QUORUM] Node 3: quorum is not owned by anyone
00000264.00000938::2009/08/04-19:06:10.379 WARN [QUORUM] Node 3: One off quorum (1 2 3)
00000264.00000938::2009/08/04-19:06:10.379 INFO [QUORUM] Node 3: death timer is started at 2009/08/04-19:06:10.379 and expires in 20 seconds
00000264.00001b3c::2009/08/04-19:06:31.357 ERR [QUORUM] Node 3: Death timer expired after 20 seconds (death timer started at 2009/08/04-19:06:10.379). Lost quorum.
00000264.00001b3c::2009/08/04-19:06:31.357 ERR lost quorum (status = 5925)
00000264.00001b3c::2009/08/04-19:06:31.357 ERR FatalError is Calling Exit Process.
00000264.00000734::2009/08/04-19:06:31.358 INFO [CS] About to exit process...