Trabalhos de proteção para vários servidores protegidos falham com erros

Este artigo ajuda você a corrigir mensagens de erros sobre detalhes do trabalho com falha para vários servidores protegidos no DPM (Data Protection Manager).

Versão original do produto: System Center Data Protection Manager
Número de KB original: 971411

Sintomas

Você recebe uma ou mais das seguintes mensagens de erro sobre trabalhos com falha para vários servidores protegidos no System Center Data Protection Manager. Esses erros podem ocorrer para vários tipos de trabalhos, incluindo sincronização, pontos de recuperação e marcar de consistência.

Tipo: Status do ponto de recuperação: descrição com falha: ocorreu um erro inesperado durante a execução do trabalho. (ID 104 Detalhes: código de erro interno: 0x80990A51)

Tipo: Status do backup de fita: Descrição com falha: o DPM falhou ao se comunicar com o agente de proteção no Server_name.com porque o acesso foi negado. (Detalhes da ID 42: o acesso é negado (0x80070005))

O DPM não pôde se comunicar com o serviço do Agente de Proteção em ProtectedServer.Contoso.local. (Detalhes da ID 308: o servidor RPC não está disponível (0x800706BA))

A operação do agente de proteção falhou porque o DPM não pôde se comunicar com o serviço do Agente de Proteção em protected.server.contoso.com. (Detalhes da ID 308: o servidor RPC não está disponível (0x800706BA))

Tipo: Status do ponto de recuperação: Descrição com falha: o agente de proteção no Server_name.com foi temporariamente incapaz de responder porque estava em um estado inesperado. (ID 60 Detalhes: código de erro interno: 0x809909B0)

O serviço DPM não pôde se comunicar com o agente de proteção em ProtectedServer.Contoso.local. (Detalhes da ID 52: uma conexão existente foi fechada à força pelo host remoto (0x80072746))

O serviço DPM não pôde se comunicar com o agente de proteção em ProtectedServer.Contoso.local. (Detalhes da ID 52: o período de tempo limite do semáforo expirou (0x80070079))

O DPM não se comunicou com o agente de proteção em ProtectedServer.Contoso.local porque o agente não está respondendo. (ID 43 Detalhes: código de erro interno: 0x8099090E)

O DPM não se comunicou com ProtectedServer.Contoso.local porque o computador é inacessível. (Detalhes da ID 41: nenhuma conexão poderia ser feita porque o computador de destino o recusou ativamente (0x8007274D))

Motivo

Esse problema ocorrerá se a rede estiver com alta latência ou se a rede estiver saturada com transferências de dados. Quando essas condições são verdadeiras, o tráfego DCOM é atrasado. Isso faz com que os agentes fiquem sem tempo intermitentemente.

Solução alternativa

Para contornar esse problema, siga estas etapas para adicionar algumas entradas de registro no servidor DPM e no servidor protegido.

  1. No Bloco de Notas, cole as entradas a seguir no arquivo e salve o arquivo como DPMAgentTimeout.reg.

    Windows Registry Editor Version 5.00
    
    [HKEY_LOCAL_MACHINE\Software\Microsoft\Microsoft Data Protection Manager\Agent]
    "ConnectionNoActivityTimeoutForNonCCJobs"=dword:00001c20
    "ConnectionNoActivityTimeout"=dword:00001c20
    "AbortAgentOnLockTimeout"=dword:00000001
    "CommandTimeout"=dword:1b7740
    
    [HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Tcpip\Parameters]
    "TcpMaxDataRetransmissions"=dword:00000010
    
  2. Clique com o botão direito do mouse no arquivo DPMAgentTimeout.reg e selecione Mesclagem.

  3. Reinicie o serviço DPMRA ou o servidor para que as alterações entrem em vigor.

Se o problema persistir, habilite a limitação do DPM de 85 a 90% para garantir que a largura de banda esteja disponível para chamadas DCOM. Você pode habilitar a limitação de largura de banda para cada servidor protegido na guia Agentes na guia Gerenciamento .

Para obter mais informações sobre o TcpMaxDataRetransmissions valor, consulte Como modificar o tempo limite máximo de retransmissão TCP/IP. Além disso, execute o software antivírus no servidor DPM.

Mais informações

Há canais diferentes para as informações de controle e dados que passam entre o servidor DPM e um servidor protegido. O caminho de controle usa o canal DCOM (RPC) e o caminho de dados usa TCP/IP. Se o caminho de dados saturar completamente a rede (mesmo que por uma curta duração), as chamadas DCOM poderão falhar. Se as chamadas falharem, isso fará com que o trabalho falhe. Para evitar esse problema, habilite a limitação para os servidores protegidos limitarem o uso de rede do caminho de dados para 85%.

Por padrão, a limitação não está habilitada no DPM porque a limitação requer que o QoS (Qualidade de Serviço) seja instalado no servidor DPM e no servidor protegido.

Se a configuração de 85% não resolve o problema completamente, aumente o nível de limitação do servidor protegido que tem o problema.

Se essa solução não resolve o problema, o servidor DPM talvez esteja sobrecarregado. Tente reorganizar os grupos de proteção para que os backups sejam escalonados ou para que as sincronizações ocorram em horários escalonados.