イベント ID 1135 のクラスターの問題のトラブルシューティング

このガイドの内容

フェールオーバー クラスタリング環境でクラスター サービスの起動中に記録される可能性があるイベント ID 1135 の診断と解決に役立ちます。

対象

クラスター サービスのイベント ID 1135 の解決をサポートする管理者。

内容

状況に応じた一連のトラブルシューティングの手順を案内します。

推定完了時間:

30 ~ 60 分。

開始ページ

イベント ID 1135 は、アクティブなフェールオーバー クラスター メンバーシップから 1 つ以上のクラスター ノードを削除できないことを示します。 この問題と共に、次のような症状が発生する場合があります。 

推奨される初期トラブルシューティング手順の 1 つとして、検証およびネットワーク テストを実行し、問題の原因となっている可能性がある構成の問題がないことを確認してください。


推奨される修正プログラムがインストールされているかどうかを確認する

クラスター サービスは、フェールオーバー クラスター操作のすべての側面を制御する重要なソフトウェア コンポーネントで、クラスター構成データベースを管理します。 イベント ID 1135 が発生した場合、以下のサポート技術情報に記載されている修正プログラムをインストールし、クラスターのすべてのノードを再起動して、問題が再び発生するかどうかを確認することをお勧めします。

すべてのノード上でクラスター サービスが実行されているかどうかを確認する

使用している Windows オペレーティング システムに合わせて以下のコマンドを実行し、クラスター サービスが継続的に実行されて使用可能であること確認してください。

Windows Server 2008 R2 クラスターの場合:

管理者特権を持つコマンド プロンプトから次のコマンドを実行します: cluster.exe node /stat

Windows Server 2012 および Windows Server 2012 R2 クラスターの場合:

次の PS コマンドを実行します: cluster node /status


すべてのノード上でクラスター サービスが継続的に実行されて使用可能になっていますか?

開始ページ

イベント ID 1135 は、アクティブなフェールオーバー クラスター メンバーシップから 1 つ以上のクラスター ノードを削除できないことを示します。 この問題と共に、次のような症状が発生する場合があります。 

推奨される初期トラブルシューティング手順の 1 つとして、検証およびネットワーク テストを実行し、問題の原因となっている可能性がある構成の問題がないことを確認してください。


推奨される修正プログラムがインストールされているかどうかを確認する

クラスター サービスは、フェールオーバー クラスター操作のすべての側面を制御する重要なソフトウェア コンポーネントで、クラスター構成データベースを管理します。 イベント ID 1135 が発生した場合、以下のサポート技術情報に記載されている修正プログラムをインストールし、クラスターのすべてのノードを再起動して、問題が再び発生するかどうかを確認することをお勧めします。

すべてのノード上でクラスター サービスが実行されているかどうかを確認する

使用している Windows オペレーティング システムに合わせて以下のコマンドを実行し、クラスター サービスが継続的に実行されて使用可能であること確認してください。

Windows Server 2008 R2 クラスターの場合:

管理者特権を持つコマンド プロンプトから次のコマンドを実行します: cluster.exe node /stat

Windows Server 2012 および Windows Server 2012 R2 クラスターの場合:

次の PS コマンドを実行します: cluster node /status


すべてのノード上でクラスター サービスが継続的に実行されて使用可能になっていますか?

クラスター サービス エラーの解決策

クラスター サービスでエラーが発生している場合、次のリンクを使用してトラブルシューティングを行います。 http://blogs.technet.com/b/askcore/archive/2010/06/08/windows-server-2008-and-2008r2-failover-cluster-startup-switches.aspx


問題は解決されましたか?

イベント ID 1135 のいくつかのシナリオ

クラスターのすべてのノードでシステム イベント ログを詳しく参照してください。 ノードで発生しているイベント ID 1135 を確認し、このイベントのすべてのインスタンスをコピーします。 このようにすると、それらを簡単に見つけて確認できるようになります。

Event ID 1135Cluster node ‘NODE A’ was removed from the active failover cluster membership. The Cluster service on this node may have stopped. This could also be due to the node having lost communication with other active nodes in the failover cluster. Run the Validate a Configuration wizard to check your network configuration. If the condition persists, check for hardware or software errors related to the network adapters on this node. Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.
次の 3 つの一般的なシナリオがあります。

シナリオ A:

すべてのイベントを見ると、クラスター内のすべてのノードが、ノード A の通信が切断されたことを示しています。

3878_image11
 
3878_image12
 

ノード A のシステム ログを見ると、クラスター内のすべての残りのノードのイベントが記録されています。

シナリオ B:

ノード上でイベントを表示すると、たとえば、クラスターが 2 つのサイトに分散されています。 ノード A、ノード B、ノード C がサイト 1 にあり、ノード D とノード E がサイト 2 にあります。

3878_image13
 

ノード A、B、C で、ノード D および E への接続に関するイベントがログに記録されていることがわかります。同様に、ノード D および E で表示されるイベントで、A、B、C との通信が切断されたことが示されています。

3878_image14
 

シナリオ C:

ノード上でイベントを表示すると、ノードの名前が特定のパターンで検出されていないことがわかります。 たとえば、クラスターが 2 つのサイトに分散されています。 ノード A、ノード B、ノード C がサイト 1 にあり、ノード D とノード E がサイト 2 にあります。

  • ノード A で: ノード B、D、E のイベントが表示されます。
  • ノード B で: ノード C、D、E のイベントが表示されます。
  • ノード C で: ノード A、B、E のイベントが表示されます。
  • ノード D で: ノード A、C、E のイベントが表示されます。
  • ノード E で: ノード B、C、D のイベントが表示されます。
  • またはその他の組み合わせで表示されます。 

3878_image16
 


シナリオを選択してください:

シナリオ A の解決策

これは、問題が発生したときに、ネットワークの輻輳またはノード A との通信が切断されたことが原因になっていることを示唆しています。

ネットワークの構成および通信の問題を確認する必要があります。 ノード A に関係する問題を探してください。


問題は解決されましたか?

シナリオ B の解決策

このような現象が発生した場合、これらのサイトを接続するリンク上で通信エラーが発生したこと示しています。 サイト間の接続を確認すること、および WAN 接続経由である場合は、接続に関して ISP に確認することをお勧めします。


問題は解決されましたか?

シナリオ C の解決策

このようなイベントは、ノード間のネットワーク チャネルが非常に混雑し、クラスターの通信メッセージが正常なタイミングで到着しないために、クラスターがノード間の通信が切断されたと判断し、結果としてクラスター メンバーシップからノードが削除された場合に発生する可能性があります。


問題は解決されましたか?

クラスター ネットワークを確認する

次の 3 つのオプションを 1 つずつ確認し、このトラブルシューティング ガイドの手順を続けることで、クラスター ネットワークを確認することをお勧めします。


実行したい項目をお選びください。

ウイルス対策の除外を確認する

クラスター サービスを実行しているサーバー上でウイルス スキャンから次のファイル システムの場所を除外します。

  • ファイル共有のミラーリング監視のパス:
  • %Systemroot%\Cluster フォルダー。
ウイルス対策ソフトウェア内のリアルタイム スキャン コンポーネントで次のディレクトリおよびファイルが除外されるように構成します。
  • 既定の仮想マシン構成ディレクトリ (C:\ProgramData\Microsoft\Windows\Hyper-V)
  • カスタム仮想マシン構成ディレクトリ
  • 既定の仮想ハード ディスク ドライブ ディレクトリ (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)
  • カスタム仮想ハード ディスク ドライブ ディレクトリ
  • カスタム レプリケーション データ ディレクトリ (Hyper-V レプリカを使用している場合)
  • スナップショット ディレクトリ
  • mms.exe (注: 場合によっては、ウイルス対策ソフトウェアでこのファイルを処理から除外するように構成する必要があります)。
  • Vmwp.exe (注: 場合によっては、ウイルス対策ソフトウェアでこのファイルを処理から除外するように構成する必要があります)。
また、クラスターの共有ボリューム (CSV) と一緒にライブ マイグレーションを使用するときは、CSV パス "C:\Clusterstorage" とそのすべてのサブディレクトリを除外します。
クラスター サービスのフェールオーバー問題または一般的な問題をトラブルシューティングしていて、ウイルス対策ソフトウェアがインストールされている場合、ウイルス対策ソフトウェアを一時的にアンインストールするか、またはソフトウェアの製造元に問い合わせて、ウイルス対策ソフトウェアがクラスター サービスと共に動作するかどうかを判定してください。 ほとんどの場合、ウイルス対策ソフトウェアを無効にするだけでは不十分です。 ウイルス対策ソフトウェアを無効にしても、コンピューターを再起動したときにフィルター ドライバーが読み込まれます。

問題は解決されましたか?
ファイアウォール内のネットワーク ポートの構成を確認する

クラスター サービスは、サーバー クラスターの処理を制御し、クラスター データベースを管理します。 クラスターとは、単一のコンピューターとして機能する、独立したコンピューターの集合です。 マネージャー、プログラマ、ユーザーには、クラスターは単一のシステムとして表示されます。 ソフトウェアによってクラスターのノード間でデータの分散が行われるため、 1 つのノードでエラーが発生しても、他のノードによって、失われたノードで提供されていたサービスとデータが提供されます。 ノードが追加または修復されると、クラスター ソフトウェアによりそのノードに一部のデータが移行されます。

システム サービス名: ClusSvc

 アプリケーション プロトコル ポート
 クラスター サービスUDP  3343
 クラスター サービス TCP 3343 (このポートは、ノードの参加操作時に必要です)
 RPC TCP 135
 クラスター アドミニストレータ UDP 137
 Kerberos UDP/TCP 464*
 SMB TCP 445
 ランダムに割り当てられた高い UDP ポート** UDP1024 ~ 65535 のランダムなポート番号
49152 ~ 65535 のランダムなポート番号*** 

注:

さらに、Windows Server 2008 以上での Windows フェールオーバー クラスターの検証を正常に行うために、ICMP4、ICMP6 用の受信および送信トラフィックを許可します。 

* 詳細については、「エラー 0xc000005e が発生して Windows Server 2012 フェールオーバー クラスターの作成が失敗する」 (http://support.microsoft.com/kb/2830510/ja) を参照してください。

** これらのポートをカスタマイズする方法の詳細については、KB832017 の「関連情報」の「リモート プロシージャ コールと DCOM」を参照してください

*** これは、Windows Server 2012、Windows 8、Windows Server 2008 R2、Windows 7、Windows Server 2008、および Windows Vista の範囲です。

さらに、次のコマンドを実行し、ファイアウォールのネットワーク ポートの構成を確認してください。 例: このコマンドは、フェールオーバー クラスターで使用されるポート 3343 が使用可能で開いていることを確認するために役立ちます。

netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose


問題は解決されましたか?

クラスター検証レポートを実行し、エラーまたは警告がないか確認する

クラスター検証ツールは、一連のテストを実行して、ハードウェアおよび設定がフェールオーバー クラスタリングと互換性があることを確認します。

画面の指示に従って操作します。

  1. クラスター検証レポートを実行し、エラーまたは警告がないか確認します。詳細については、このブログを参照してください。
    3878_image4
     
  2. 下の資料を参照し、ネットワークの警告およびエラーを確認してください: https://technet.microsoft.com/ja-jp/library/cc771323.aspx
    3878_image5
     
    3878_image6
     


実行したい項目をお選びください。

ネットワーク バインド順序の一覧を確認する

このテストでは、各ノード上でネットワークがアダプターにバインドされる順序を一覧表示します。

[アダプターとバインド] タブには、ネットワーク サービスによって接続がアクセスされる順序で接続が一覧表示されます。 これらの接続の順序は、汎用 TCP/IP 呼び出し/パケットがネットワークに送信される順序を反映しています。

以下の手順に従って、ネットワーク アダプターのバインド順序を変更します。

  1. [スタート] ボタン、[ファイル名を指定して実行] の順ににクリックします。「ncpa.cpl」と入力し、[OK] をクリックします。 [ネットワーク接続] ウィンドウの [LAN または高速インターネット] セクションに、使用可能な接続が表示されます。
  2. [詳細設定] メニューの [詳細設定] をクリックし、[アダプターとバインド] タブをクリックします。
  3. [接続] で、一覧の上の方に移動する接続を選びます。 矢印ボタンを使用して接続を移動します。 一般的に、ネットワークと通信するカード (ドメイン接続、他のネットワークへのルーティングなど) は、最初にバインドされる (一覧の一番上にある) カードです。

クラスター ノードはマルチホーム システムです。 ネットワーク優先順位は DNS クライアントの送信ネットワーク接続に影響を与えます。 クライアント通信に使用されているネットワーク アダプターはバインド順序の最上位にする必要があります。 ルーティングされていないネットワークは低い優先順位に配置できます。 Windows Server 2012 および Windows Server2012 R2 では、クラスター ネットワーク ドライバー (NETFT.SYS) アダプターは自動的に、バインド順序の最下位に配置されます。


問題は解決されましたか?

ネットワーク通信を確認する

ネットワークの遅延が原因でこの問題が発生することもあります。 パケットがノード間で失われていないとしても、パケットのノードへの到着が遅れたためにタイムアウト期間が経過する場合があります。

このテストでは、すべてのネットワーク上でサーバーが許容可能な遅延の範囲で通信できることを確認します。

例: [ネットワーク通信の検証] で、ネットワークの遅延の問題に関する次のメッセージが表示されることがあります。

Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).Either address 10.0.0.96 is not reachable from 192.168.0.2 or the ping latency is greater than the maximum allowed 2000 ms This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networksEither address 192.168.0.2 is not reachable from 10.0.0.96 or the ping latency is greater than the maximum allowed 2000 ms This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks
マルチサイト クラスターの場合は、タイムアウト値を増やすことができます。

WAN 接続の問題について ISP に確認します。


他に問題が発生していますか?


ネットワーク パケットがノード間で失われる
  1. パフォーマンス モニターを使用してパケット損失を確認する
    ノード間の有線接続のいずれかの場所でパケットが失われる場合、ハートビートが失敗します。 パフォーマンス モニターを使用して、"Network Interface\Packets Received Discarded" カウンターを参照すると、これが問題になっているかどうかを簡単に確認できます。 このカウンターを追加したら、平均、最大値、および最小値の番号を確認し、ゼロより大きい値があるかどうかを確認します。それから、受信バッファーをアダプターに合わせて調整する必要があります。
    3878_image17
     
    VmWare 仮想化プラットフォームでネットワーク パケットの損失が発生する場合は、「クラスターが VmWare 仮想化プラットフォームにインストールされている」セクションを参照してください。
  2. NIC ドライバーをアップグレードする
    この問題は、NIC ドライバー/統合コンポーネント (IC)/VmTools が古いか、NIC アダプターの不具合によって発生する場合があります。
    物理マシンのノード間でネットワーク パケットの損失が発生する場合は、ネットワーク アダプター ドライバーを更新してください。 ネットワーク カード ドライバーまたはファームウェアが古いか、期限が切れています。
    ネットワーク カードやスイッチの構成が単に正しくないことが原因でハートビート損失が発生する場合もあります。

問題は解決されましたか?




クラスターが VmWare 仮想化プラットフォームにインストールされている

VMware 環境の場合に VMware アダプターの問題を確認する

この問題は、トラフィックが増加しているときにパケットが破棄された場合に発生することがあります。

トラフィックのフィルタリング (メール フィルターなどによる) が実行されていないことを確認します。 この可能性を排除した後で、ゲスト オペレーティング システムでバッファーの数を徐々に増やして確認します。

トラフィックの増加による破棄を減らすには、以下の手順を実行します。

  1. Windows キーと R キーを使用して、[ファイル名を指定して実行] ボックスを開きます。
  2. 「devmgmt.msc」と入力し、Enter キーを押します。
  3. [ネットワーク アダプター] を展開します
  4. [vmxnet3] を右クリックし、[プロパティ] をクリックします。
  5. [詳細設定] タブをクリックします。
  6. [Small Rx Buffers] をクリックし、値を増やします。 既定値は 512 で、最大値は 8192 です。
  7. [Rx Ring #1 Size] をクリックし、値を増やします。 既定値は 1024 で、最大値は 4096 です。

VMware 環境の場合、以下の URL を参照して、VMware アダプターの問題を確認してください。

http://blogs.technet.com/b/askcore/archive/2013/06/03/nodes-being-removed-from-failover-cluster-membership-on-vmware-esx.aspx

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2039495

ネットワークの混雑が認識される

ネットワークの混雑は、ネットワーク接続の問題が原因で発生することもあります。

MS およびベンダーの推奨事項に従ってネットワークが構成されていることを確認します。

Windows フェールオーバー クラスター ネットワークの構成を確認しますhttp://blogs.technet.com/b/askcore/archive/2014/02/20/configuring-windows-failover-cluster-networks.aspx

ネットワーク構成を確認します。

引き続き問題が解決しない場合は、クラスターの GUI にパーティション化されたネットワークが表示されているかどうか、またはハートビート NIC で NIC チーミングが有効になっているかどうかを確認してください。


どのような問題が発生していますか?

クラスターの GUI にパーティション化されたネットワークが表示される

クラスターの GUI にパーティション化されたネットワークが表示される場合は、次のブログの資料を参照して、この問題のトラブルシューティングを行うことができます。 http://blogs.technet.com/b/askcore/archive/2011/08/08/partitioned-cluster-networks.aspx


問題は解決されましたか?

NIC ドライバーをアップグレードする

この問題は、NIC ドライバーが古くなっているか、NIC アダプターに障害があることが原因で発生する可能性があります。

物理マシン上でノード間のネットワーク パケットが失われる場合は、ネットワーク アダプター ドライバーを更新してください。 または、古くなったネットワーク カード ドライバーまたはファームウェアを更新します。

場合によっては、ネットワーク カードまたはスイッチの単純な構成ミスがハートビートが失われる原因になることがあります。


問題は解決されましたか?

ネットワーク構成を確認します。

引き続き問題が解決しない場合は、クラスターの GUI にパーティション化されたネットワークが表示されているかどうか、またはハートビート NIC で NIC チーミングが有効になっているかどうかを確認してください。


どのような問題が発生していますか?

ハートビート NIC で NIC チーミングが有効になっている。

ハートビート NIC で NIC チーミングが有効になっている場合は、チーミング ベンダーの推奨事項に従ってチーミング ソフトウェアの機能を確認してください。


問題は解決されましたか?

おめでとうございます。

クラスターの問題は解決しています。

申し訳ありません

このガイドでは、お客様の問題を解決できません。 この問題のその他の解決方法については、TechNet サポート フォーラムを参照するか、Microsoft サポートにお問い合わせください。

ネットワークの混雑が認識される

ネットワークの混雑は、ネットワーク接続の問題が原因で発生することもあります。

MS およびベンダーの推奨事項に従ってネットワークが構成されていることを確認します。

Windows フェールオーバー クラスター ネットワークの構成を確認しますhttp://blogs.technet.com/b/askcore/archive/2014/02/20/configuring-windows-failover-cluster-networks.aspx

ネットワーク構成を確認します。

引き続き問題が解決しない場合は、クラスターの GUI にパーティション化されたネットワークが表示されているかどうか、またはハートビート NIC で NIC チーミングが有効になっているかどうかを確認してください。


どのような問題が発生していますか?

プロパティ

文書番号:10158 - 最終更新日: 2016/10/06 - リビジョン: 1

フィードバック