El volumen reFS que usa DPM deja de responder en Windows Server 2016

Este artículo ayuda a resolver un problema en el que el volumen DPM o ReFS deja de responder en Windows Server 2016.

Se aplica a: Windows Server 2016
Número de KB original: 4035951

Síntoma

Observa que un volumen del sistema de archivos resistente (ReFS) que usa Administración de protección de datos (DPM) deja de responder o se bloquea al realizar copias de seguridad, en concreto cuando DPM emite operaciones de clonación de bloques grandes.

Causa

DPM usa vhd montados en bucle invertido. Aparecen como discos normales en el sistema operativo. Por lo tanto, estos discos se muestran en el Explorador de Windows, Diskmgt y otras herramientas de GUI. Estas herramientas sondean periódicamente los discos para asegurarse de que funcionan correctamente. Esto hace que los IOs se envíen por la pila de bucle invertido al volumen ReFS. Si el volumen reFS está ocupado, estos IOs tendrán que esperar. Por lo tanto, cuando ReFS realiza una operación de larga duración, como el vaciado o una llamada de clonación en bloque de gran tamaño, estos IOs tendrán que esperar más tiempo. Cuando estos IOs están bloqueados, la interfaz de usuario del Explorador o Diskmgt no se actualizará. Como resultado, parece que los discos están bloqueados o desmontados.

Además, el controlador de minipuerto de montaje en bucle invertido (vhdmp) comienza a generar eventos de advertencia si los IOs no se completan en 30 segundos.

Nota:

No se produce ningún error en la operación de E/S o del sistema de archivos durante este proceso. Todas las operaciones se realizarán correctamente y tardarán más tiempo. Además, no se desmontará ningún volumen. Este problema es solo un problema de latencia de operación del sistema de archivos, lo que hace que la interfaz de usuario se bloquee y que los controladores de puerto registren errores.

Solución

Este problema se resuelve en la actualización acumulativa del 18 de julio de 2017. La corrección contiene:

  • Tres parámetros del Registro que se pueden sintonizar
  • Un cambio de directiva que evita la realización de vaciados de volumen innecesarios, lo que impide que ReFS agregue una latencia elevada a los IOS de ReFS en curso.

Más información

Cómo establecer los parámetros que se pueden ajustar

Importante

Antes de seguir estos pasos, asegúrese de que ha leído e implementado los tres parámetros del Registro, como se describe en el artículo de KB 4016173. Si no solucionan adecuadamente los problemas que se producen, no deshabilite estos parámetros del Registro. Estos parámetros y los descritos en esta sección no se superponen funcionalmente, por lo que se pueden usar juntos.

Esta actualización describe parámetros adicionales del Registro que ayudan a solucionar los problemas de latencia descritos en la sección "Síntomas". Estos parámetros se pueden usar en cualquier combinación.

Advertencia

Pueden producirse problemas graves si cambia el registro incorrectamente mediante Editor del Registro o mediante otro método. Estos problemas pueden requerir que vuelva a instalar el sistema operativo. Microsoft no puede garantizar que estos problemas se puedan resolver. Cambie el registro a su propio riesgo.

Importante

  • Se requiere un reinicio para que estos cambios de parámetro surtan efecto.
  • Estos parámetros deben establecerse de forma coherente en cada nodo de un clúster de conmutación por error.

Parámetros ajustables

Opción 1

Esta opción deshabilita los anclajes almacenados en caché, que eran una causa principal del gran conjunto de trabajo activo.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Nombre del valor: RefsDisableCachedPins
  • Establecer RefsDisableCachedPins = 1
  • Tipo de valor: REG_DWORD

Opción 2

Esta opción agrega una heurística a la lógica de puntos de comprobación de ReFS, lo que hace que ReFS llegue a un punto de comprobación cuando la cola de eliminación alcance un tamaño determinado. Los IOs se bloquean en ReFS porque la lógica del punto de control se bloquearía al procesar una cola de eliminación grande.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Nombre del valor: RefsProcessedDeleteQueueEntryCountThreshold
  • Establecer RefsProcessedDeleteQueueEntryCountThreshold = 2048
  • Tipo de valor: REG_DWORD

Nota:

Establecer RefsProcessedDeleteQueueEntryThreshold en valores inferiores hace que ReFS controle con más frecuencia. Establezca el valor en 2048 y, a continuación, reduzca el valor a 1024 y luego a 512.

Opción 3

Las llamadas a extensiones duplicadas grandes introducen latencia en el sistema, ya que otras operaciones tendrán que esperar hasta que se completen estas operaciones de larga duración. Esta opción reduce el tamaño de la llamada a extensiones duplicadas.

Nota:

DPM establecerá este cambio de clave del Registro como el valor predeterminado como parte de UR4, que se publicará en agosto de 2017.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Data Protection Manager\Configuration\DiskStorage
  • Nombre del valor: DuplicateExtentBatchSizeinMB
  • Establezca DuplicateExtentBatchSizeinMB = 100. (El valor predeterminado es 2000 [2 GB]. Se acepta cualquier valor entre 1 y 4095).
  • Tipo de valor: REG_DWORD

Opción 4

Esta opción amplía TimeOutValue.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Disk
  • Nombre del valor: TimeOutValue
  • Establecer TimeOutValue (en segundos) = 0x78
  • Tipo de valor: REG_DWORD

Nota:

El valor predeterminado de TimeOutValue es 0x41 (65 decimal). 0x78 se traduce en 120 decimales.