Como o serviço cluster reserva um disco e traz um disco online

Este artigo descreve como o serviço do Cluster da Microsoft se reserva e traz discos online gerenciados pelo serviço de cluster e drivers relacionados.

Aplica-se a: Windows Server 2003
Número de KB original: 309186

Mais informações

O serviço cluster usa apenas o protocolo SCSI para gerenciar discos no barramento compartilhado.

Observação

Isso não significa que todos os discos sejam do tipo SCSI, especificando a interface de hardware conhecida como SCSI, mas sim que a unidade de armazenamento deve ser capaz de interpretar e processar corretamente o protocolo SCSI e os comandos.

A lista a seguir de comandos é os recursos adicionais do protocolo SCSI que serão usados quando os discos estiverem em um ambiente clusterizado.

  • reserve: este comando é emitido por um adaptador de barramento host para obter ou manter a propriedade de um dispositivo SCSI. Um dispositivo reservado recusa todos os comandos de todos os outros adaptadores de barramento de host, exceto aquele que o reservou inicialmente, o iniciador.

  • release: esse comando é emitido pelo adaptador de barramento de host proprietário quando um recurso de disco é retirado offline; ele libera um dispositivo SCSI para outro adaptador de barramento de host a ser reservado.

  • reset: este comando quebra a reserva em um dispositivo de destino. Esse comando pode ser uma redefinição de barramento (para o barramento inteiro) ou, usando os drivers de storport, uma redefinição direcionada para um determinado dispositivo no barramento. O procedimento a seguir descreve como um cluster de servidor inicia e ganha o controle dos discos compartilhados. Este cenário pressupõe que apenas um nó esteja sendo ativado por vez:

Quando o computador é iniciado, o Driver de Disco de Cluster (Clusdisk.sys) lê a seguinte chave de registro local para obter uma lista das assinaturas dos discos compartilhados em gerenciamento de cluster: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ClusDisk\Parameters \Signatures

Depois que a lista é obtida, o serviço de cluster tenta examinar todos os dispositivos no barramento SCSI compartilhado para encontrar assinaturas de disco correspondentes.

Quando o primeiro nó no cluster é iniciado, o driver de disco de cluster marca primeiro todos os LUNs (LUN: número de unidade lógica, um identificador exclusivo usado em um barramento SCSI para distinguir entre dispositivos que compartilham o mesmo barramento) que correspondem à chave Assinaturas como volumes offline. Observe que isso não é o mesmo que tirar um recurso de cluster offline. O volume é marcado offline para impedir que vários nós tenham acesso de gravação aos volumes simultaneamente. Se o cluster for um cluster de disco compartilhado, um dos discos será designado como disco de quorum pelo serviço de cluster. O disco quorum é o primeiro recurso colocado online quando o serviço de cluster tenta formar um cluster.

Quando o serviço de cluster no nó de formação é iniciado, ele primeiro tenta colocar online o dispositivo físico designado como disco de quorum. Ele executa o algoritmo de arbitragem de disco no disco de quorum para obter a propriedade. Em arbitragem bem-sucedida, o serviço de cluster envia uma solicitação ao clusdisk para começar a enviar reservas periódicas para o disco (para manter a propriedade). Em seguida, o serviço de cluster envia uma solicitação ao clusdisk para desbloquear o acesso ao disco de quorum e monta os volumes no disco. A montagem bem-sucedida dos volumes conclui o procedimento online e o serviço de cluster continua com o processo de formulário de cluster. A solicitação é passada do driver de disco de cluster para a pilha do driver de armazenamento da Microsoft e, por fim, para o driver específico para o HBA que se comunica com os discos. Ele também pode ser passado para qualquer software multipata em execução na pilha de armazenamento.

Depois que o controlador de armazenamento/driver de dispositivo informa que o dispositivo foi reservado com êxito, o serviço de cluster garante que a unidade possa ser lida e gravada. Depois que o disco passou por todos esses testes, o recurso de disco é marcado como online e o serviço de cluster continua a colocar todos os outros recursos online.

Cada nó no cluster renova as reservas para qualquer LUNs que ele possui a cada três segundos. Se os nós de um cluster perderem a comunicação de rede uns com os outros (por exemplo, se não houver comunicação pela rede privada ou pública), os nós iniciarão um processo conhecido como arbitragem para determinar a propriedade do disco de quorum. O nó que obtém a propriedade dos recursos do disco quorum na perda total de comunicação entre o nó de cluster permanecerá funcional. Todos os nós que não puderem se comunicar e não conseguirem manter ou adquirir a propriedade do disco quorum encerrarão o serviço de cluster e todos os recursos que o nó estava hospedando serão movidos para outro nó no cluster.

  1. O nó que atualmente possui o disco de quorum é o nó de defesa. O defensor pressupõe que está se defendendo contra quaisquer nós de cluster com os quais não pode se comunicar e para os quais não recebeu uma notificação de desligamento. O defensor renova continuamente sua reserva ao quorum solicitando que uma reserva SCSI seja colocada no LUN a cada três segundos.

  2. Todos os outros nós (nós que não possuem o disco de quorum e não podem se comunicar com o nó que possui o recurso quorum) tornam-se nós desafiadores.

  3. Quando o desafiante detecta a perda de todas as comunicações, ele solicita imediatamente uma redefinição de SCSI em todo o barramento para interromper quaisquer reservas existentes.

  4. Sete segundos após a redefinição do SCSI solicitada, o desafiante tenta reservar o disco de quorum. Se o nó defender estiver online e funcionando, ele já terá reservado o disco de quorum, como normalmente faz a cada três segundos. O desafiante detecta que não pode reservar o quorum e encerra o serviço de cluster. Se o defender não estiver funcionando corretamente, o desafiante poderá reservar com êxito o disco de quorum. Após dez segundos, o desafiante coloca o quorum online e assume a propriedade de todos os recursos no cluster. Se o nó de defesa perder a propriedade do dispositivo quorum, o serviço de cluster no nó de defesa será encerrado imediatamente.

Quando um nó de cluster tira um recurso de disco offline, ele solicita que a reserva SCSI seja liberada e, em seguida, a unidade estará novamente indisponível para o sistema operacional. Sempre que um recurso de disco estiver offline em um cluster, o volume ao qual o recurso aponta (o disco com a assinatura correspondente) será inacessível para o sistema operacional em qualquer um dos nós de cluster.