2 ノードのサーバー クラスタにおけるネットワーク障害の検出と回復 (2008 ベース)

詳細

クラスター サービスは、サーバー クラスター上のネットワーク インターフェースの状態を検出する為に、クラスターのノードからノードへハートビートを送信したり、ノードの運用情報のモニターを行います。ハートビートは、各ネットワーク インターフェースが動作していることを確認する為に、サーバー クラスターのノード マネージャー間で 1 秒 (既定) ごとに送受信します。その単一のハートビート パケットには UDP (User Datagram Protocol) パケットが使用されます。 

定期的に送受信が行われるハートビート パケットが一定の数 (時間) 応答が無い場合に、クラスターはハートビートの遅延または切断として、そのネットワーク上でノード間の 疎通に問題があることを認識します。しかし、ノード間の疎通失敗を検知しても送受信相手からの応答がないことがわかるのみで、障害発生箇所が途中のネットワーク経路なのか相手ノードの問題か確認できません。その為、クラスターはサービスを提供するパブリック ネットワークでこのような状況が検知された場合には、各ノード共通でアクセス可能なデフォルト ゲートウェイに対して疎通確認を行い障害箇所の特定を試みます。疎通確認は PING と同等の処理を実行し、ICMP 応答の有無を以て障害箇所を探します。そしてネットワーク障害が発生後、より早く障害の発生していないノードにサービスまたはアプリケーションを移動させる為、PING の送信先はデフォルト ゲートウェイのみに限定し、また PING の再送信も行いません。

これらの要件から、デフォルトゲートウェイの設定はサービスを提供するパブリック ネットワークにおいて必須条件となります。 


以下に 2 ノード環境においてのネットワークの障害発生時の動きについて例を用いて説明 します。

シナリオ 1:デフォルト ゲートウェイへ片ノードのみ通信可能な場合
•       ノード A のネットワーク インターフェースでネットワーク障害が発生します。
•       ノード A とノード B は通信できません。
•       ノード B はデフォルト ゲートウェイと通信できます。
•       ノード A はデフォルト ゲートウェイと通信できません。

結果
•       ノード A のネットワーク インターフェースは到達不能となり、その後状態は失敗となります。
•       ノード B のネットワーク インターフェースは到達不能となり、その後状態は稼動中となります。
•       ネットワークの状態は稼動中です。
•       障害を起こしたネットワーク インターフェースに依存する TCP/IP アドレス リソースを持つノード A 上のリソース グループは、ノード B にフェールオーバーします。

シナリオ 2:デフォルト ゲートウェイへ両ノード通信出来ない場合
•       ノード A のネットワーク インターフェースでネットワーク障害が発生します。
•       ノード A とノード B は通信できません。
•       ノード A とノード B はデフォルト ゲートウェイと通信できません。

結果
•       ノード A とノード B 両方のネットワーク インターフェースの状態は到達不能となり、ネットワークの状態はパーティション分割になります。
•       リソース グループはフェールオーバーせず、オンラインのまま現在の所有者のノードに留まります。

デフォルト ゲートウェイの設定がされていない場合には上記の “シナリオ 2” と同様の動作になります。

関連情報

Windows Server 2003 について確認したい場合には、以下の技術情報を確認してください。

2 ノードのサーバー クラスタにおけるネットワーク障害の検出と回復 (242600)
プロパティ

文書番号:2862888 - 最終更新日: 2016/10/31 - リビジョン: 1

Windows Server 2008 Enterprise, Windows Server 2008 Datacenter, Windows Server 2008 R2 Datacenter, Windows Server 2008 R2 Enterprise

フィードバック