Überwachung und Problembehandlung bei Verfügbarkeitsgruppen

Dieser Leitfaden unterstützt Sie bei den ersten Schritten mit der Überwachung von Verfügbarkeitsgruppen und der Behandlung einiger gängiger Probleme in Bezug auf Verfügbarkeitsgruppen. Zudem bietet der Leitfaden Originalinhalte sowie eine Angebotsseite mit nützlichen Informationen, die an anderer Stelle veröffentlicht wurden. Im Rahmen dieses Leitfadens können zwar nicht alle Probleme, die auf dem umfassenden Gebiet der Verfügbarkeitsgruppen auftreten können, im Detail erläutert werden, allerdings kann auf die richtige Richtung bezüglich der Ursachenanalyse und Problemlösung gewiesen werden.

Da Verfügbarkeitsgruppen eine integrierte Technologie darstellen, sind viele der auftretenden Probleme möglicherweise Anzeichen für andere Probleme in Ihrem Datenbanksystem. Einige Probleme werden durch Einstellungen in einer Verfügbarkeitsgruppe verursacht, z.B. eine angehaltene Verfügbarkeitsdatenbank. Darüber hinaus können Probleme mit anderen Aspekten von SQL Server auftreten, z.B. SQL Server-Einstellungen und Bereitstellungen von Datenbankdateien, sowie systemische Leistungsprobleme, die unabhängig von der Verfügbarkeit bestehen. Dennoch können andere Probleme außerhalb von SQL Server auftreten, z.B. Probleme mit Netzwerk-E/As, TCP/IP, Active Directory und Windows Server Failover Clustering (WSFC). Oftmals muss bei Problemen, die sich bei einer Verfügbarkeitsgruppe, einem Replikat oder einer Datenbank abzeichnen, an mehreren Technologien Korrekturen vorgenommen werden, um die Ursache zu ermitteln.

Problembehandlungsszenarios

Die folgende Tabelle enthält Links zu allgemeinen Problembehandlungsszenarien für Verfügbarkeitsgruppen. Sie werden nach den jeweiligen Szenariotypen kategorisiert, z.B. Konfiguration, Clientkonnektivität, Failover und Leistung.

Szenario Szenariotyp BESCHREIBUNG
Problembehandlung für die Always On-Verfügbarkeitsgruppenkonfiguration (SQL Server) Konfiguration Enthält Informationen, um Sie bei der Behandlung typischer Probleme mit der Konfiguration von Serverinstanzen für Verfügbarkeitsgruppen zu unterstützen. Typische Konfigurationsprobleme sind:

– Verfügbarkeitsgruppen sind deaktiviert.
– Konten sind falsch konfiguriert.
– Der Datenbankspiegelungsendpunkt ist nicht vorhanden.
– Der Endpunkt ist nicht erreichbar (SQL Server-Fehler 1418).
– Der Netzwerkzugriff ist nicht vorhanden.
– Fehler beim Verknüpfen der Datenbank (SQL Server-Fehler 35250)
Problembehandlung bei einem fehlgeschlagenen Vorgang zum Hinzufügen einer Datei (Always On-Verfügbarkeitsgruppen) Konfiguration Ein Vorgang zum Hinzufügen einer Datei hat dazu geführt, dass die sekundäre Datenbank angehalten wird und sich im Zustand SYNCHRONISIERUNG WIRD NICHT AUSGEFÜHRT befindet.
Es kann keine Verbindung mit dem Verfügbarkeitsgruppenlistener in einer Umgebung mit mehreren Subnetzen hergestellt werden. Clientkonnektivität Wenn Sie keinen Verfügbarkeitsgruppenlistener konfiguriert haben, können Sie nicht den Listener pingen oder eine Verbindung zwischen diesem und einer Anwendung herstellen.
Behandlung von Fehlern bei einem automatischen Failover Failover Ein automatisches Failover wurde nicht erfolgreich durchgeführt.
Problembehandlung: Verfügbarkeitsgruppe hat RTO überschritten Leistung Nach einem automatischen Failover oder einem geplanten manuellen Failover ohne Datenverlust überschreitet die Failoverzeit die RTO. Ein anderer Fall: Wenn Sie die Failoverzeit eines sekundären Replikats im synchronen Commitmodus (z.B. eines Partners für das automatische Failover) einschätzen, stellen Sie fest, dass diese Ihre RTO überschreitet.
Problembehandlung: Verfügbarkeitsgruppe hat RPO überschritten Leistung Nachdem Sie ein erzwungenes manuelles Failover ausgeführt haben, ist der Datenverlust größer als Ihre RPO. Ein anderer Fall: Wenn Sie den möglichen Datenverlust eines sekundäres Replikats im asynchronen Commitmodus berechnen, stellen Sie fest, dass dieser Ihre RPO überschreitet.
Problembehandlung: Änderungen am primären Replikat spiegeln sich nicht im sekundären Replikat wider Leistung Die Clientanwendung führt erfolgreich ein Update für das primäre Replikat durch, wobei jedoch die Abfrage des sekundären Replikats ergibt, dass die Änderung nicht widergespiegelt wird.
Problembehandlung: Hoher HADR_SYNC_COMMIT-Wartetyp mit Always On-Verfügbarkeitsgruppen Leistung Wenn HADR_SYNC_COMMIT ungewöhnlich lang ist, besteht ein Leistungsproblem beim Datenverschiebungsfluss oder der Protokollfestschreibung für ein sekundäres Replikat.

Hilfreiche Tools für die Problembehandlung

Bei der Konfiguration oder Ausführung von Verfügbarkeitsgruppen können Sie mithilfe verschiedener Tools unterschiedliche Arten von Problemen diagnostizieren. Die folgende Tabelle enthält Links zu nützlichen Informationen über die Tools.

Tool Beschreibung
Verwenden des Always On-Dashboards (SQL Server Management Studio) Bietet auf einer benutzerfreundlichen Oberfläche einen prägnanten Überblick über die Integrität der Verfügbarkeitsgruppe.
Always On-Richtlinien Werden vom Always On-Dashboard verwendet.
SQL Server-Fehlerprotokoll (Always On-Verfügbarkeitsgruppen) Protokolliert Statusübergangsereignisse für Verfügbarkeitsgruppen, -replikate und -datenbanken, Status von anderen Always On-Komponenten und Always On-Fehler.
CLUSTER.LOG (Always On-Verfügbarkeitsgruppen) Protokolliert Clusterereignisse wie Statusübergänge der Verfügbarkeitsgruppenressource sowie Ereignisse und Fehler der SQL Server-Ressourcen-DLL.
Always On-Integritätsdiagnoseprotokoll Protokolliert die SQL Server-Integritätsdiagnose, die dem WSFC-Cluster (SQL Server-Ressourcen-DLL) über sp_server_diagnostics (Transact-SQL) gemeldet wird.
Dynamische Verwaltungssichten und Systemkatalogsichten (Always On-Verfügbarkeitsgruppen) Meldet Informationen zu den Verfügbarkeitsgruppen wie Konfiguration, Integritätsstatus und Leistungsmetriken.
Erweiterte Always On-Ereignisse Stellt ausführliche Diagnoseinformationen zu den Verfügbarkeitsgruppen bereit und ist für Ursachenanalysen geeignet.
Always On-Wartetypen Stellt die Wartestatistik speziell für Verfügbarkeitsgruppen bereit und ist für die Leistungsoptimierung geeignet.
Always On-Leistungsindikatoren Überwachen die im Systemmonitor dargestellte Verfügbarkeitsgruppenaktivität und sind für die Leistungsoptimierung geeignet. Weitere Informationen finden Sie unter SQL Server-Verfügbarkeitsreplikatobjekt und SQL Server-Datenbankreplikatobjekt.
Always On-Ringpuffer Erfassen Warnungen innerhalb des SQL Server-Systems für die interne Diagnose und können zum Debuggen von Problemen im Zusammenhang mit Verfügbarkeitsgruppen verwendet werden.

Überwachen von Verfügbarkeitsgruppen

Der ideale Zeitpunkt, um ein Problem mit einer Verfügbarkeitsgruppe zu behandeln, bevor ein Problem ein Failover erfordert, unabhängig davon, ob dieses automatisch oder manuell erfolgt. Dies kann erreicht werden, indem die Leistungsmetriken der Verfügbarkeitsgruppe überwacht und Warnungen gesendet werden, wenn die Verfügbarkeitsreplikate außerhalb der Beschränkungen Ihrer Vereinbarung zum Servicelevel (SLA) ausgeführt werden. Wenn ein sekundäres Replikat im synchronen Commitmodus beispielsweise Leistungsprobleme aufweist, die dazu führen, dass sich die geschätzte Failoverzeit verlängert, sollten Sie nicht bis zum Auftreten eines automatischen Failovers warten. Anderenfalls werden Sie feststellen, dass die Failoverzeit Ihre Recovery Time Objective überschreitet.

Da Verfügbarkeitsgruppen zu Hochverfügbarkeits- und Notfallwiederherstellungslösungen gehören, stellen die wichtigsten zu überwachenden Leistungsmetriken die geschätzte Failoverzeit (Ihre Recovery Time Objective, RTO, betreffend) und der potenzielle Datenverlust bei einem Notfall (Ihre Recovery Point Objective, RPO, betreffend) dar. Sie können diese Metriken anhand der Daten erfassen, die SQL Server zu einem bestimmten Zeitpunkt verfügbar macht, sodass Sie über Probleme mit den HADR-Funktionen (High Availability Disaster Recovery) Ihres Systems benachrichtigt werden, bevor tatsächlich Fehlerereignisse auftreten. Aus diesem Grund ist es wichtig, sich mit dem Datensynchronisierungsprozess von Verfügbarkeitsgruppen vertraut zu machen und die entsprechenden Metriken zu erfassen.

Die untenstehende Tabelle verweist auf Artikel, mit denen Sie die Integrität Ihrer Verfügbarkeitsgruppenlösung überwachen können.

Artikel BESCHREIBUNG
Überwachen der Leistung von Always On-Verfügbarkeitsgruppen In diesem Thema werden der Datensynchronisierungsprozess für Verfügbarkeitsgruppen, die Flusssteuerungsgates und nützliche Metriken für die Überwachung einer Verfügbarkeitsgruppe sowie der Prozess zum Erfassen der Metriken RTO und RPO beschrieben.
Überwachen von Verfügbarkeitsgruppen (SQL Server) Dieses Thema enthält Informationen zu Tools für die Überwachung einer Verfügbarkeitsgruppe.
The Always On Health Model Part 1 – Health Model Architecture (Das Always On-Integritätsmodell Teil 1 – Architektur des Integritätsmodells) Dieses Thema enthält eine Übersicht über das Always On-Integritätsmodell.
The Always On Health Model Part 2 – Extending the Health Model (Das Always On-Integritätsmodell Teil 2 – Erweitern des Integritätsmodells) In diesem Thema wird erläutert, wie das Always On-Integritätsmodell und das Always On-Dashboard zur Anzeige weiterer Informationen angepasst werden.
Monitoring Always On Health with PowerShell – Part 1: Basic Cmdlet Overview (Überwachen der Always On-Integrität mit PowerShell – Teil 1: Übersicht über grundlegende Cmdlets) Dieses Thema enthält eine grundlegende Übersicht über die PowerShell-Cmdlets, die zur Überwachung der Integrität einer Verfügbarkeitsgruppe verwendet werden können.
Monitoring Always On Health with PowerShell – Part 2: Advanced Cmdlet Usage (Überwachen der Always On-Integrität mit PowerShell – Teil 2: Verwendung erweiterter Cmdlets) Dieses Thema enthält Informationen über die erweiterte Verwendung der Always On-PowerShell-Cmdlets zum Überwachen der Integrität einer Verfügbarkeitsgruppe.
Monitoring Always On Health with PowerShell – Part 3 : A Simple Monitoring Application (Überwachen der Always On-Integrität mit PowerShell – Teil 3: Eine einfache Überwachungsanwendung) In diesem Thema wird erläutert, wie eine Verfügbarkeitsgruppe mit einer Anwendung automatisch überwacht wird.
Monitoring Always On Health with PowerShell – Part 4 : Integration with SQL Server Agent (Überwachen der Always On-Integrität mit PowerShell – Teil 4: Integration im SQL Server-Agent) Dieses Thema enthält Informationen darüber, wie die Überwachung der Verfügbarkeitsgruppe in SQL Server-Agent integriert und Benachrichtigung für die zuständigen Personen bei Problemen konfiguriert werden.

Nächste Schritte