ReFS-volume met DPM reageert niet meer op Windows Server 2016

Dit artikel helpt bij het oplossen van een probleem waarbij het DPM- of ReFS-volume niet meer reageert op Windows Server 2016.

Van toepassing op: Windows Server 2016
Origineel KB-nummer: 4035951

Symptoom

U ziet dat een ReFS-volume (Resilient File System) dat gebruikmaakt van Data Protection Management (DPM) niet meer reageert of vastloopt wanneer u back-ups uitvoert, met name wanneer DPM grote blok-kloonbewerkingen uitgeeft.

Oorzaak

DPM maakt gebruik van loopback-mounted-VHD's. Deze lijken op normale schijven voor het besturingssysteem. Daarom worden deze schijven weergegeven in Windows Verkenner, Diskmgt en andere GUI-hulpprogramma's. Deze hulpprogramma's peilen regelmatig de schijven om er zeker van te zijn dat ze correct werken. Hierdoor worden IO's de loopbackstack naar het ReFS-volume verzonden. Als het ReFS-volume bezet is, moeten deze IO's wachten. Daarom moeten deze IO's langer wachten wanneer ReFS een langdurige bewerking uitvoert, zoals doorspoelen of een grote aanroep met blokklonen. Wanneer deze IO's vastlopen, wordt de gebruikersinterface van Explorer of Diskmgt niet vernieuwd. Als gevolg hiervan lijkt het alsof de schijven zijn vastgelopen of losgekoppeld.

Bovendien begint het minipoortstuurprogramma voor loopback-mount (vhdmp) waarschuwingsevenementen te genereren als er io's niet binnen 30 seconden worden voltooid.

Opmerking

Er mislukt geen IO- of bestandssysteembewerking tijdens dit proces. Alle bewerkingen zullen lukken en ze zullen alleen langer duren. Er wordt ook geen volume ontkoppeld. Dit probleem is alleen een latentieprobleem met bestandssysteembewerkingen, waardoor de gebruikersinterface vastloopt en poortstuurprogramma's fouten registreren.

Oplossing

Dit probleem is opgelost in de cumulatieve update van 18 juli 2017. De oplossing bevat:

  • Drie registerparameters die niet in staat zijn
  • Een beleidswijziging die onnodige volume-flushs voorkomt, waardoor ReFS geen zware latentie toevoegt aan lopende ReFS-IO's.

Meer informatie

De instelbare parameters instellen

Belangrijk

Voordat u deze stappen uitvoert, moet u ervoor zorgen dat u de drie registerparameters hebt gelezen en geïmplementeerd, zoals beschreven in het KB-artikel 4016173. Als hiermee eventuele problemen die u ondervindt niet voldoende worden opgelost, schakelt u deze registerparameters niet uit. Deze parameters en de parameters die in deze sectie worden beschreven, overlappen elkaar niet functioneel, zodat ze samen kunnen worden gebruikt.

Deze update beschrijft aanvullende registerparameters die helpen bij het oplossen van de latentieproblemen die worden beschreven in de sectie Symptomen. Deze parameters kunnen in elke combinatie worden gebruikt.

Waarschuwing

Er kunnen ernstige problemen optreden als u het register onjuist wijzigt met behulp van Register Editor of met een andere methode. Voor deze problemen moet u het besturingssysteem mogelijk opnieuw installeren. Microsoft kan niet garanderen dat deze problemen kunnen worden opgelost. Wijzig het register op eigen risico.

Belangrijk

  • Deze parameterwijzigingen moeten opnieuw worden opgestart om van kracht te worden.
  • Deze parameters moeten consistent worden ingesteld op elk knooppunt van een failovercluster.

Niet-instelbare parameters

Optie 1

Met deze optie worden pinnen in de cache uitgeschakeld, die een belangrijke oorzaak waren van de grote actieve werkset.

Geef de aangegeven waarden op in de volgende subsleutel:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Waardenaam: RefsDisableCachedPins
  • RefsDisableCachedPins instellen = 1
  • Waardetype: REG_DWORD

Optie 2

Met deze optie wordt een heuristiek toegevoegd aan de ReFS-controlepuntlogica, waardoor ReFS naar het controlepunt gaat wanneer de verwijderwachtrij een bepaalde grootte bereikt. IO's zijn vastgelopen op ReFS omdat de controlepuntlogica vastloopt bij het verwerken van een grote verwijderingswachtrij.

Geef de aangegeven waarden op in de volgende subsleutel:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Waardenaam: RefsProcessedDeleteQueueEntryCountThreshold
  • Set RefsProcessedDeleteQueueEntryCountThreshold = 2048
  • Waardetype: REG_DWORD

Opmerking

Het instellen van RefsProcessedDeleteQueueEntryThreshold op lagere waarden zorgt ervoor dat ReFS vaker het controlepunt krijgt. Stel de waarde in op 2048 en verlaag de waarde vervolgens tot 1024 en vervolgens 512.

Optie 3

Grote dubbele aanroepen zorgen voor latentie in het systeem, omdat andere bewerkingen moeten wachten totdat deze langlopende bewerkingen zijn voltooid. Deze optie vermindert de grootte van de aanroep van dubbele bereiken.

Opmerking

DPM stelt deze registersleutelwijziging in als de standaardwaarde als onderdeel van UR4, die in augustus 2017 wordt uitgebracht.

Geef de aangegeven waarden op in de volgende subsleutel:

  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Data Protection Manager\Configuration\DiskStorage
  • Waardenaam: DuplicateExtentBatchSizeinMB
  • Stel DuplicateExtentBatchSizeinMB = 100 in. (De standaardwaarde is 2000 [2 GB]. Elke waarde van 1 - 4095 wordt geaccepteerd).
  • Waardetype: REG_DWORD

Optie 4

Met deze optie wordt de TimeOutValue uitgebreid.

Geef de aangegeven waarden op in de volgende subsleutel:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Disk
  • Waardenaam: TimeOutValue
  • TimeOutValue instellen (in seconden) = 0x78
  • Waardetype: REG_DWORD

Opmerking

De standaardwaarde voor TimeOutValue is 0x41 (65 decimaal). 0x78 wordt omgezet in 120 decimaal.