重新启动活动节点时,群集服务停止响应群集节点


症状


当您重新启动包含两个或多个节点的服务器群集的活动节点时,将遇到下列所有症状:
  • 如果你在其余节点上运行群集管理器,则当你尝试连接到群集时收到以下错误消息:
    群集 "ClusterName" 不再可用。
  • 如果您尝试启动群集管理器,群集管理器停止响应,您可能会收到以下错误消息:
    尝试在 "ServerName" 处打开群集时发生错误:该接口未知。错误 ID:1717(000006b5)。
  • 查看 C:\Winnt\群集的内容时,您会看到类似于以下内容的信息:
    [FM] OnlineGroup: Failed on resource e3f4af72-6454-4199-b9af-fa6f57032a65. Status 70Microsoft Clustering Service suffered an unexpected fatal errorat line 701 of source module D:\nt\private\cluster\service\fm\group.c. The error code was 70. 
  • 当重新启动的群集节点成功启动时,运行在其他节点上的群集管理器程序将按预期响应。

原因


如果暂停服务器群集的一个节点,然后重新启动活动群集节点,则会出现此问题。 当活动节点重新启动时,暂停的节点会尝试使资源组联机。 由于此节点已暂停,因此节点无法进行其他连接,并且不能使仲裁磁盘组联机。 错误代码70对应于以下错误消息:
远程服务器已暂停或正在启动过程中。
注意 这些结果也会出现在具有两个以上节点的群集中。 即使在活动节点重新启动时,处于工作状态的非暂停节点仍然存在,如果暂停的节点是第一个与取得仲裁磁盘所有权的节点。 非暂停节点不具有仲裁磁盘仲裁的机会。

解决方案


若要解决此问题,请在重新启动活动群集节点之前恢复暂停的群集节点。注意 在恢复暂停的群集节点之前,必须首先确定群集节点是否已暂停。
  1. 依次单击“开始”、“运行”,在“打开”框中键入 cmd,然后单击“确定”
  2. 在命令提示符处,键入 " 群集节点",然后按 enter。 将显示类似于以下内容的输出。注意 以下示例输出基于两节点群集配置。 如果有两个以上的节点,则其他节点也会显示在列表中。
    Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 PausedCLUSTER-2            2 Up 
    注意 如果未暂停的唯一群集节点在重启过程中,则会收到以下错误消息:
    出现系统错误1753。终结点映射程序没有更多终结点可用。
  3. 在命令提示符处,键入 群集节点 node_name /resume (其中 node_name 是群集节点的名称),然后按 ENTER。 例如,键入 " cluster node cluster-1 /resume",然后按 ENTER。 显示类似于以下内容的信息:
    Resuming node 'cluster-1'...Node           Node ID Status-------------- ------- ---------------------CLUSTER-1            1 Up