Gilt für
Windows 11 Windows 10

​​​​​​​

Die Sprachausgabe ist eine in Windows 11 integrierte Sprachausgabeanwendung, sodass Sie nichts herunterladen oder installieren müssen. In diesem Leitfaden wird beschrieben, wie Sie die Sprachausgabe mit Windows verwenden, damit Sie Apps verwenden, im Web surfen und vieles mehr können.

Unterhalb des Inhaltsverzeichnisses finden Sie einen Abschnitt zu den Neuerungen in der Sprachausgabe.

Hinweis: Dieser Leitfaden ist als Word-Dokument und als PDF-Datei (nur in Englisch) verfügbar. Um die Dokumente herunterzuladen, wechseln Sie zu Windows 11 Vollständige Anleitung zur Sprachausgabe. Wenn Sie weitere Sprachen oder Formate erhalten möchten, wenden Sie sich an den Answer Desk für Menschen mit Behinderungen.

Sie möchten erfahren, wie Sie mit der Sprachausgabe Aufgaben in Office-Apps wie Outlook und Word ausführen können? Lesen Sie die Artikel auf dieser Seite: Verwenden einer Sprachausgabe mit Office-Apps.

Folgen Sie diesen Links, um zu erfahren, wie Sie eine Sprachausgabe verwenden, um aufgaben in Windows 11:

Inhaltsverzeichnis

Kapitel

Inhalt

Kapitel 1: Einführung in die Sprachausgabe

Eine Übersicht über die Sprachausgabe mit Informationen, wie sie diese starten und beenden.

Kapitel 2: Grundlagen der Sprachausgabe

Grundlegende Funktionen des Bildschirms, Suchen und Öffnen von Apps, Ändern des von der Sprachausgabe vorgelesen Inhalts und Einstellen der Sprechgeschwindigkeit und Lautstärke.

Kapitel 3: Verwenden des Scanmodus

Verwenden des Scanmodus in der Sprachausgabe für die Navigation in Apps, in E-Mails und im Web.

Kapitel 4: Vorlesen von Text

Informationen zum Lesen und Abrufen zum Abrufen von Informationen zum Text wie beispielsweise Schriftart, Farbe und Satzzeichen.

Kapitel 5: Navigation

Hier erfahren Sie, wie Sie mithilfe von Sprachausgabeansichten mehr Informationen zu der App oder Seite erhalten, die Sie erkunden.

Kapitel 6: Verwenden der Sprachausgabe mit Toucheingabe

Verwenden der Sprachausgabe mit Toucheingabe, einschließlich grundlegender Gesten.

Kapitel 7: Anpassen der Sprachausgabe

Hier erfahren Sie, wie Sie den Start der Sprachausgabe ändern, wie viel Feedback Sie bei der Eingabe hören, Wie Sie die Sprachausgabebefehle ändern und Sprachsynthesesoftware (Text-to-Speech, TTS) von Drittanbietern verwenden.

Kapitel 8: Verwenden der Sprachausgabe mit Braille

Verwenden der Sprachausgabe mit aktualisierbarer Braille-Anzeige.

Anhang A: Unterstützte Sprachen und Stimmen

Eine Liste der unterstützten Sprachen für ältere und natürliche Stimmen in der Sprachausgabe.

Anhang B: Tastaturbefehle und Touchgesten für die Sprachausgabe

Liste der Tastaturbefehle und Touchgesten für die Sprachausgabe.

Anhang C: Unterstützte Braille-Anzeigen

Eine Liste der von der Sprachausgabe unterstützten Braille-Anzeigen.

Anhang D: Sprachausgabe-Sounds

Eine Liste der Sounds, die die Sprachausgabe verwendet und was diese Sounds bedeuten.

Anhang E: Sprachausgabe mit Outlook

Verwenden der Sprachausgabe mit der Outlook-Erweiterung

Anhang F: Sprachausgabe mit Excel

Verwenden der Sprachausgabe mit der Excel-Erweiterung

Anhang G: Problembehandlung bei der Einrichtung von Natürlichen Stimmen für die Sprachausgabe

Behandeln von Problemen beim Einrichten der Sprachausgabe für natürliche Stimmen.

Anhang H: Liste der behobenen Probleme und Fehler

Eine Liste der in diesem Release behobenen Probleme und Fehler.

Anhang I: Befehle für das alte Tastaturlayout

Eine Liste der älteren Tastaturlayoutbefehle.

Anhang J: Verlauf der Sprachausgabe-Updates

Eine Liste des Updateverlaufs der Sprachausgabe.

Neuerungen in der Sprachausgabe

Versionsrelease im März 2026

Status-Leiste lesen

Sprachausgabebenutzer können jetzt einen neuen Befehl Sprachausgabetaste+\ verwenden, um Inhalte von status Leiste in Apps wie Microsoft Word, Excel, PowerPoint usw. zu lesen. In Microsoft Word können Benutzer dies beispielsweise verwenden, um die Anzahl von Seiten oder Wörtern in einem Dokument zu lesen. In Microsoft Excel können Benutzer einige Datenzellen auswählen und die Summe oder den Durchschnitt der Daten in den ausgewählten Zellen hören, ohne den Fokus ändern zu müssen.

Einbinden von Copilot-gestützten Bildbeschreibungen in die Sprachausgabe 

Letztes Jahr haben wir umfangreiche Bildbeschreibungen in der Sprachausgabe auf Copilot+-PCs eingeführt, sodass blinde und sehbehinderte Benutzer detaillierte, KI-generierte Beschreibungen von Bildern, Diagrammen und Diagrammen hören können.Die Sprachausgabe kann jetzt mit Copilot auf allen Windows 11 Geräten arbeiten, um Bilder und visuelle Elemente auf dem Bildschirm besser zu verstehen.

Sie können die Sprachausgabetaste +STRG+D drücken, um das fokussierte Bild zu beschreiben, oder die Sprachausgabetaste +STRG+S drücken, um den Vollbildmodus zu beschreiben. Copilot wird geöffnet, und das Image ist bereit, sodass Sie Ihre eigene Eingabeaufforderung eingeben und eine Beschreibung generieren können, die auf Das zugeschnitten ist, was Sie wissen möchten. Wichtig ist, dass das Image nur freigegeben wird, nachdem Sie es beschrieben haben. Sie behalten bei jedem Schritt die Kontrolle.

Versionsrelease im Januar 2026

Personalisieren, was die Sprachausgabe ankündigt 

Die Sprachausgabe bietet Ihnen jetzt mehr Kontrolle darüber, wie Informationen gesprochen werden, wenn Sie in ui-Elementen in einer App navigieren. Jede App besteht aus verschiedenen Steuerelementtypen, z. B. Schaltflächen, Kontrollkästchen, Links, Schiebereglern und Textfeldern. Jedes Steuerelement enthält Eigenschaften (z. B. Name, Rolle oder Status) und Werte (z. B. einen auf "75%" festgelegten Schieberegler). Die Sprachausgabe liest diese in der Regel in einer festen Reihenfolge vor, aber Sie können jetzt auswählen, welche Eigenschaften gesprochen werden, und deren Reihenfolge so neu anordnen, dass sie Ihren Vorlieben entspricht.

Wenn Sie beispielsweise auf die Schaltfläche Absenden gelangen, kann die Sprachausgabe die Schaltfläche "Senden" ankündigen. Bei der Personalisierung können Sie wählen, ob Sie zuerst die Bezeichnung hören, zuerst die Rolle oder etwas weglassen möchten, das Sie nicht benötigen. Bei einem Kontrollkästchen können Sie entscheiden, ob der Status ("aktiviert" oder "nicht aktiviert") vor oder nach der Bezeichnung auftreten soll – oder ob Sie den Zustand überhaupt nicht hören möchten.Um diese Ankündigungen anzupassen, drücken Sie sprachausgabe +ALT+P. Dort können Sie die Eigenschaften der Sprachausgabe für jeden Steuerelementtyp auswählen, deaktivieren & neu anordnen.

Sie können Änderungen schneller vornehmen, indem Sie ein Eingabefeld in natürlicher Sprache ausschließlich auf Copilot+-PCs verwenden. Geben Sie einfach die gewünschten Angaben ein, z. B. "Keine Auswahlinformationen oder Positionsinformationen ankündigen". Diese Änderungen gelten für diesen Steuerelementtyp in der app, die Sie derzeit verwenden.Sie können auch eine Vorschau anzeigen, wie Ihre personalisierte Ankündigung klingt, bevor Sie Ihre Änderungen speichern. Wenn Sie jemals zurückkehren möchten, wählen Sie einfach Auf Standardwerte zurücksetzen aus, um das ursprüngliche Ankündigungsmuster der Sprachausgabe wiederherzustellen.Die Detailebene der Shape-Sprachausgabe ist so, wie Sie es bevorzugen – klarer, besser vorhersagbar und an der Gewünschten Navigation ausgerichtet.   Benutzeroberfläche mit dem Anpassungsbereich der Sprachausgabe in Windows 11.

Versionsrelease im November 2025

HD-Stimmen in der Sprachausgabe

Die Sprachausgabe unterstützt jetzt hochauflösende Stimmen für Englisch (USA), die von Azure neuesten Sprachsynthesemodellen auf gerätenbasierten Geräten unterstützt werden. Diese Stimmen verwenden generative KI, um Ton und Geschwindigkeit für natürlichere, ausdrucksstarke Sprache anzupassen.

Wenn Sie mit der Sprachausgabe lesen oder Text in der Bildschirmlupe hören, bieten HD-Stimmen klarere Audiodaten und einen reibungsloseren Ablauf. Dies trägt dazu bei, die Ermüdung des Zuhörens während langer Sitzungen zu reduzieren und es einfacher, sich auf den Inhalt zu konzentrieren. Während natürliche Stimmen in mehreren Sprachen verfügbar sind, werden HD-Stimmen derzeit in Englisch (USA) angeboten. Mit der Sprachausgabe können Sie Ihre Erfahrung personalisieren, indem Sie die Sprachgeschwindigkeit anpassen und jederzeit zwischen den Stimmen wechseln.So aktivieren Sie die Sprachausgabe:

  1. Öffnen Sie Einstellungen > Barrierefreiheit > Sprachausgabe.

  2. Navigieren Sie zur Schaltfläche Natürliche Stimme hinzufügen.

  3. Laden Sie Ihre bevorzugte HD-Stimme herunter.

  4. Wechseln Sie in den Einstellungen für die Sprachausgabe jederzeit die Stimmen oder passen Sie die Geschwindigkeit an.

Derzeit sind HD-Stimmen in Englisch (USA) verfügbar, wobei eine männliche (Andrew) und eine weibliche Option (Ava) zur Auswahl stehen. Es gibt auch HD-Stimmen in Französisch und Chinesisch.

Verbesserte Tastatur- und Sprachausgabeunterstützung für Kommentare in Word

Wenn Sie in einem Dokument navigieren und sich die Einfügemarke in Text befindet, der einen Kommentar enthält, können Sie ALT+F12 drücken, um in den kontextbezogenen Kommentar Karte zu wechseln. Nachdem wir uns auf die Karte konzentriert haben, haben wir einige Verbesserungen eingeführt, um die Zusammenarbeit zu vereinfachen:

  1. Intelligentere Nutzung von Home/End: Die Tasten "Start" und "Ende " verhalten sich nun kontextabhängig. Je nachdem, wo Sich Ihr Fokus befindet – auf einem Kommentar Karte, Kommentarthread oder Textabschnitt – werden Sie mit der Taste "Start" oder "Ende" nun an den Anfang bzw. das Ende dieses Abschnitts verschoben, wodurch die Navigation wesentlich nahtloser wird.

  2. Intuitiveres Esc-Verhalten: Durch Drücken der ESC-Taste wird der Fokus jetzt zuverlässig durch Ihren Workflow zurück verschoben, vom Thread zum Karte und von Karte zur Canvas – anstatt Sie direkt zurück zur Canvas zu senden . So bleiben Sie orientierungsorientiert.

  3. Eingeschränkte Aktivierreihenfolge in erweiterten Kommentarkarten: Tabstopps sind jetzt logisch gruppiert, und es gibt weniger Tabstopps, um Unterbrechungen zu begrenzen: Sie navigieren zuerst zum Kommentar im Thread (z. B. "Kommentar 2 von 5"), dann Threadaktionen (z. B. "Kommentar mit Gefällt mir" oder "Kommentar bearbeiten") und dann zum @Erwähnung- oder Antwortfeld.

  4. Seitenübergreifende Navigation in der Kontextansicht: Sie können jetzt nahtlos über Kommentare in der Kontextansicht navigieren, auch wenn sie sich über Seiten erstrecken, indem Sie die NACH-UNTEN-TASTE verwenden. Zuvor wurde das Drücken der NACH-UNTEN-TASTE am Ende einer Seite beendet.

  5. Neue Tastenkombination für die Sprachausgabe: Für Benutzer, die Dokumente mit der Sprachausgabe lesen, haben wir eine leistungsstarke neue Verknüpfung eingeführt: ALT+UMSCHALT+'. Mit dieser einfachen Verknüpfung können Benutzer den vollständigen Kontext eines Kommentars hören, z. B. den Namen des Kommentarautors, jede zugewiesene Aufgabe und die Anzahl der Antworten (falls zutreffend) – ohne den Zeichenbereich verlassen oder den Fokus verschieben zu müssen. Wenn sich der Fokus bereits auf einem Kommentar Karte befindet, liest das Drücken der gleichen Tastenkombination den auskommentierte Textbereich vor, damit Benutzer immer wissen, auf welchen Teil des Dokuments sich der Kommentar bezieht. Wenn es keinen Kommentar zu dem markierten Text gibt, wird dies von der Sprachausgabe deutlich angekündigt und jegliche Vermutungen entfernt.

Versionsrelease im Oktober 2025

Verbesserte Benutzerfreundlichkeit für die Verwendung von Word

Wir haben mehrere Verbesserungen implementiert, um sicherzustellen, dass die Sprachausgabe eine nahtlosere und zuverlässigere Erfahrung bei der Interaktion mit Dokumenten in Word bietet. Diese Aktualisierungen wurden entwickelt, um die Intuitiveität und Effizienz von Lese-, Schreib- und Bearbeitungsaufgaben zu verbessern.

Erweitertes Sprachfeedback: Die Sprachausgabe behält jetzt beim Ankündigen von Überschriften und Grammatik- oder Rechtschreibfehlern eine konsistente Tonhöhe bei und sorgt so für eine reibungslosere und weniger ablenkende Erfahrung für Benutzer natürlicher Stimmen.

Erweiterte Fußnotennavigation: Benutzer können jetzt effizient in Dokumenten mithilfe von Fußnoten navigieren und die zugehörigen Fußnotennummern deutlich hören, um beim Lesen oder Bearbeiten referenzierter Materialien mehr Klarheit und Orientierung zu gewährleisten.

Konsistentes kontinuierliches Lesen: Die Sprachausgabe sorgt jetzt für eine unterbrechungsfreie Leistung in langen Textpassagen. Kontinuierliches Lesen verläuft nahtlos von Anfang bis Ende.

Seitenzahlen und Abschnittsankündigungen: Die Sprachausgabe bietet jetzt Seitenzahlen- und Abschnittsbenachrichtigungen während der Navigation in Word und hilft Benutzern dabei, die Ausrichtung in langwierigen oder komplexen Dokumenten aufrechtzuerhalten.

Überschriftenstatus: Die Sprachausgabe gibt jetzt an, ob eine Überschrift reduziert oder erweitert ist, was eine effiziente Navigation der Dokumentstruktur ermöglicht und eine schnelle Bewegung zwischen Abschnitten ermöglicht.

Kohärente und konsistente Ankündigungen für Listen: Die Sprachausgabe liefert jetzt klarere und konsistentere Listenankündigungen, unabhängig davon, wie Sie navigieren. Es werden Listendetails wie Stil und Ebene gemäß den von Ihnen ausgewählten Ausführlichkeitseinstellungen angekündigt, sodass Benutzer immer die Formatierung und ihren Platz in der Liste kennen.

Vollständiges Lesen der Liste: Die Sprachausgabe kündigt jetzt listenbezogene Elemente vollständig an, einschließlich Inhalten, die sich auf nachfolgende Zeilen erstrecken, um sicherzustellen, dass alle Informationen genau kommuniziert werden.

Listenelementnavigation: Sie können jetzt zwischen Listenelementen wechseln, indem Sie STRG+NACH-OBEN oder STRG+NACH-UNTEN-TASTE drücken.  

Erweiterte Tabellennavigationsbefehle: Die Sprachausgabe bietet jetzt verbesserte Funktionen, indem sie eine effiziente Navigation zur ersten oder letzten Zelle in einer Zeile oder Spalte ermöglicht. Diese Erweiterung unterstützt Benutzer dabei, Tabellen einfacher zu durchlaufen. Die folgenden Befehle stehen für die Navigation zur Verfügung:

  • Zur ersten Zelle in einer Zeile wechseln – STRG+ALT+Komma (,)

  • Zur letzten Zelle in einer Zeile wechseln – STRG+ALT+Punkt (.)

  • Zur ersten Zelle in einer Spalte wechseln – STRG+ALT+UMSCHALT+Komma (,)

  • Zur letzten Zelle in einer Spalte wechseln – STRG+ALT+UMSCHALT+PUNKT (.)

Klarere Anleitungen an Tabellengrenzen: Wenn Sie mit der TAB-TASTE in einer bearbeitbaren Tabelle navigieren, gibt die Sprachausgabe jetzt eine Ankündigung an, wenn sie die letzte Zelle erreicht. Dies verhindert Verwechslungen und versehentliche Zeilenzufügungen. 

Die Eintragsankündigungen für Tabellen wurden verbessert: Die Sprachausgabe liest jetzt nur einmal "Tabelle eingeben" vor, wenn sie über Zellen verschoben wird, anstatt die Nachricht zu wiederholen. Diese Verbesserung bietet ein klareres Feedback und erleichtert es Ihnen, zu bestimmen, ob Sie in derselben Tabelle verbleiben.

Besseres Feedback während der Auswahl in Tabellen: Die Sprachausgabe bietet jetzt klares Feedback, wenn Sie Zellen in Tabellen auswählen und Ihre Auswahl ankündigt, wenn Sie Zellen über Zeilen, Spalten oder beides hervorheben. Es zeigt auch deutlich an, wann Ihre Textauswahl mehrere Zellen umfasst, sodass Sie immer die genaue Menge an Inhalten kennen, die Sie ausgewählt haben.

Kenntnis nicht einheitlicher Tabellen: Die Sprachausgabe benachrichtigt benutzer jetzt, wenn eine Tabelle nicht einheitlich ist, z. B. wenn einige Zeilen oder Spalten zellen fehlen, um einen nützlichen Kontext zur Struktur der Tabelle bereitzustellen.

Versionsrelease im September 2025

Abrufen der Braille- und Textausgabe auf dem Bildschirm mit braille viewer

Ein neues Feature, braille viewer, wurde eingeführt, um sowohl Textdarstellungen als auch Braille-Darstellungen von Ausgaben auf dem Bildschirm bereitzustellen, die auf einem aktualisierbaren Braille-Gerät angezeigt werden. Dieses Tool wurde entwickelt, um sehbehinderte Lehrkräfte, Hilfstechnologie-Trainer, Entwickler und Tester zu unterstützen, die keine Braille lesen oder nur eingeschränkten Zugriff auf eine Braille-Anzeige haben.

Lehrer von Schülern mit Sehbehinderung (TVIs) können die Braille-Anzeige verwenden, um die Braille-Fähigkeiten der Schüler zu verbessern oder im Klassenzimmer mitzuverfolgen, da die Lehrer die Text- und Braille-Darstellung auf dem Bildschirm visuell sehen können, während der Kursteilnehmer sie auf ihrem angeschlossenen Braille-Display vorliest.

Text- und Braille-Darstellung auf dem Bildschirm, die über einem Word Dokument angezeigt wird.

Um die Braille-Anzeige zu öffnen, starten Sie die Sprachausgabe mit WIN+STRG+EINGABETASTE, und drücken Sie Sprachausgabetaste+ALT+B. Ein neues unverankertes Fenster wird geöffnet. Der Inhalt dieses Fensters wird aktualisiert, wenn Sie die Sprachausgabe weiterhin verwenden. 

Die Anzahl der Braille-Zellen, die auf dem Viewer angezeigt werden, hängt von der Größe Der aktualisierbaren Braille-Anzeige ab. Wenn ein Display mit 80 Zellen verbunden ist, zeigt der Viewer 80 Zellen an. Wenn keine Anzeige angeschlossen ist, zeigt der Viewer standardmäßig 40 Zellen an. Sie können auch die Anzeigegröße und -position des Viewers mithilfe des Einstellungsmenüs auf dem Viewer ändern.

Hinweis: Damit die Braille-Anzeige funktioniert, stellen Sie sicher, dass die Sprachausgabe für die Braille-Ausgabe eingerichtet ist. Navigieren Sie zum Herunterladen und Installieren des Braille-Pakets zu Einstellungen > Barrierefreiheit > Sprachausgabe > Verwenden einer Braille-Anzeige mit der Sprachausgabe.

Versionsrelease im August 2025

Bildschirmvorhang in der Sprachausgabe

Die Bildschirmvorhangfunktion in der Sprachausgabe wurde entwickelt, um die Privatsphäre und den Fokus für Benutzer zu verbessern, die auf Bildschirmlesevorgänge angewiesen sind. Wenn der Bildschirmvorhang aktiviert ist, wird das Display vollständig ausgeblendet, sodass sichergestellt wird, dass nur der Benutzer über die Sprachausgabe hört, was auf dem Bildschirm angezeigt wird, während der visuelle Inhalt ausgeblendet bleibt. Dies ist besonders in öffentlichen Räumen oder freigegebenen Umgebungen nützlich, sodass Benutzer vertrauliche Informationen lesen und damit arbeiten können, ohne sie anderen in der Nähe preiszugeben. 

Beachten Sie, dass der Bildschirmvorhang nicht wirksam wird, wenn Sie ein Video aufzeichnen, Ihren Bildschirm in Videokonferenztools wie Microsoft Teams freigeben oder einen Screenshot mit der Taste "Druck" auf der Tastatur erstellen. Features wie Bildbeschreibungen funktionieren weiterhin, auch wenn der Bildschirmvorhang eingeschaltet ist. 

Aktivieren oder Deaktivieren des Bildschirmvorhangs: 

  1. Aktivieren Sie die Sprachausgabe mit STRG+ Windows-Logo-Taste+EINGABETASTE.

  2. Drücken Sie sprachausgabe+STRG+C, um den Bildschirmvorhang zu aktivieren.

  3. Versuchen Sie, die Sprachausgabe zu verwenden, während der Bildschirmvorhang eingeschaltet ist.

  4. Drücken Sie sprachausgabe+STRG+C, um den Bildschirmvorhang zu deaktivieren.

Änderungen und Verbesserungen

Wir führen eine reibungslosere Möglichkeit ein, die Funktionen der Sprachausgabe direkt aus der Erfahrung heraus zu entdecken und zu erfahren. Unabhängig davon, ob Sie ein neuer Benutzer sind oder sich mit einer tieferen Funktionalität beschäftigen, führt Sie die Sprachausgabe jetzt durch die neuen Features, indem sie eine Reihe modaler Fenster startet, die details zu allen neuen Features und Änderungen in der Sprachausgabe enthalten.

Neue Eingabeaufforderung zum Hervorheben neuer Features und Verbesserungen in der Sprachausgabe.

Ausführliche Bildbeschreibung für AMD- und Intel-gestützte® Copilot+-PCs.

Anfang dieses Jahres haben wir umfangreiche Bildbeschreibungen in der Sprachausgabe eingeführt, um die Barrierefreiheit zu verbessern, indem detaillierte Kontextinformationen für visuelle Inhalte wie Bilder, Diagramme und Diagramme bereitgestellt werden. Diese Funktionalität ermöglicht es der Sprachausgabe, umfassende Bildbeschreibungen auf Copilot+-PCs bereitzustellen, einschließlich Details zu Personen, Objekten, Farben, Text und numerischen Daten. Benutzer können auf dieses Feature zugreifen, indem Sie sprachausgabe+STRG+D drücken.

Bisher exklusiv für Snapdragon-gestützte Copilot+-PCs verfügbar, wird diese Funktion jetzt auf Geräte erweitert, die mit AMD- und Intel-Prozessoren® ausgestattet sind.

Version veröffentlicht im Mai 2025

Leichterer Zugriff auf visuelle Inhalte mit Bildbeschreibungen in der Sprachausgabe

Wir verbessern die digitale Barrierefreiheit, indem wir die Möglichkeit für die Sprachausgabe hinzufügen, umfassende, detaillierte Beschreibungen von Bildern, Diagrammen und Diagrammen mithilfe von KI auf Copilot+-PCs bereitzustellen. In der heutigen digitalen Umgebung sind Bilder auf Websites, Apps und Dokumenten weit verbreitet. Für blinde und sehbehinderte Benutzer bleiben jedoch viele Visuelle Elemente aufgrund fehlender oder unzureichender Alternativtexte unzugänglich.

Mit diesem neuen Feature generiert die Sprachausgabe nun umfangreichere Bildbeschreibungen auf Ihrem Copilot+ PC. Drücken Sie einfach die Sprachausgabetaste +STRG+D , und die Sprachausgabe gibt eine kontextbezogene Beschreibung des Bilds an und enthält Details zu Personen, Objekten, Farben, Text und Zahlen aus dem Bild. Auf Nicht-Copilot+-PCs bietet diese Benutzeroberfläche weiterhin grundlegende Bildbeschreibungen. 

Für ein Bild zur Aktienperformance erhalten Sie beispielsweise die folgende detaillierte Beschreibung: Das Bild ist ein Diagramm, das die Aktienkurse der Microsoft Corporation mit den Indizes S&P 500 und NASDAQ Computer zeigt. Das Diagramm zeigt einen stetigen Anstieg des Aktienkurses von Microsoft im Zeitraum vom 18. Juni bis zum 23. Juni.

Screenshot des Edge-Browsers mit einem Bild des "Aktienleistungsdiagramms" mit geöffnetem Fenster "Bild beschreiben" daneben mit der Beschreibung des Bilds.

Das Fenster enthält auch die Schaltflächen "Neu generieren", "Gefällt mir nicht", "Nicht gefallen" und "Kopieren" unten.

Screenshot des Edge-Browsers mit Fokus der Sprachausgabe auf einem Bild des Graphen. Oben auf dem Bildschirm befindet sich eine Infoleiste, die besagt: "Wir richten das Bildbeschreibungsfeature ein. Halten Sie Ihren PC mit dem Internet verbunden, und schauen Sie bald wieder zurück." zusammen mit einer Schaltfläche "status überprüfen".

Dieses Feature ist derzeit auf Snapdragon-betriebenen Copilot+-PCs verfügbar, wobei AMD- und Intel-Unterstützung in Kürze verfügbar ist. Wenn Sie die Bildbeschreibungsfunktion mit Sprachausgabe +STRG+D zum ersten Mal ausprobieren, laden wir die erforderlichen Modelle herunter. Überprüfen Sie download status über Einstellungen> Windows Update. Dies nimmt Zeit in Anspruch, daher setzen Sie Ihre Aufgaben fort, während das Setup abgeschlossen ist. Versuchen Sie dann erneut, die Beschreibung mit Sprachausgabe +STRG+D zu generieren.

Tipp: Die Befehle G oder UMSCHALT+G im Scanmodus können verwendet werden, um die Sprachausgabe auf verschiedene Bild- oder Graphelemente auf dem Bildschirm zu fokussieren.

Hinweis: Weitere Informationen zum Scanmodus finden Sie in Kapitel 3: Verwenden des Scanmodus. Fragen zu Datenschutz und Daten zu diesem Feature finden Sie unter Häufig gestellte Fragen zu umfangreichen Bildbeschreibungen in der Sprachausgabe Häufig gestellte Fragen zu umfangreichen Bildbeschreibungen in der Sprachausgabe.​​​​​​​

Version veröffentlicht im März 2025

In dieser Version wird die Spracherkennung in der Sprachausgabe eingeführt, wodurch das Verweisen auf gesprochene Inhalte vereinfacht wird. Greifen Sie schnell auf den Verlauf von gesprochenem Text zu, folgen Sie der Livetranskription, und kopieren Sie den letzten gesprochenen Ausdruck mit einfachen Tastenkombinationen.

Zusammenfassung der Spracherkennung

Sprachausgabefenster.

Drücken Sie Sprachausgabe +ALT+X , um die Sprachausgabe zu öffnen und die letzten 500 gesprochenen Zeichenfolgen anzuzeigen. Beachten Sie, dass der Text in diesem Fenster bei jedem Start der Sprachausgabe aktualisiert wird. Sie können Standardlesebefehle und Pfeiltasten verwenden, um den Inhalt im Sprach-Recap-Fenster zu lesen und den erforderlichen Text zu Referenzzwecken zu kopieren.  

Müssen Sie etwas speichern oder freigeben, das die Sprachausgabe zuletzt gesagt hat? Sie können es sofort kopieren, ohne das Sprachausgabefenster zu öffnen! Verwenden Sie die Sprachausgabetaste +STRG+X , um den letzten Ausdruck der Sprachausgabe in die Zwischenablage zu kopieren.

Zu den wenigen Szenarien, in denen Sie sprachrecap und verwandte Tastenkombinationen verwenden können, gehören das Verweisen auf einen Hinweis, den Sie beim Öffnen eines neuen Fensters gehört haben, das Kopieren eines gesprochenen Fehlercodes oder das Hinzufügen von Sprachausgabe zu Schulungsmaterialien.

Livetranskription

Das Sprachausgabefenster wurde in der rechten Bildschirmecke angedockt und zeigt die Echtzeittranskription der Sprachausgabe der Sprachausgabe an.

Die Livetranskription der Sprachausgabe ist nützlich für Trainer von Hilfstechnologien (Assistive Technology, AT), Lehrer für Schüler mit Sehbehinderungen (TSVI), die Schüler in der Klasse unterstützen, oder für Fachleute, die schwerhörig sind und die Sprachausgabe verwenden möchten. Um die Livetranskription der Audioausgabe anzuzeigen, verwenden Sie denselben Befehl Sprachausgabetaste +ALT+X , um das Sprachausgabefenster zu öffnen und es an dem Teil des Bildschirms anzudockt, den Sie anzeigen möchten. Während Sie Aufgaben ausführen, können Sie Echtzeittranskriptionen der Sprachausgabe sehen.

Diese Tastenkombinationen folgen einem einfachen Muster, das das Erlernen erleichtert. 

Aktion

Tastenkombination

Hören Sie erneut, was die Sprachausgabe zuletzt gesagt hat.

Sprachausgabetaste+X

Kopieren Sie, was die Sprachausgabe zuletzt gesagt hat.

Sprachausgabetaste+CTRL+X

Öffnen des Sprachrecap-Fensters für Verlaufs- und Livetranskriptionen

Sprachausgabetaste+ALT+X

Version veröffentlicht im Februar 2025

In dieser Version werden neue Tastenkombinationen im Scanmodus eingeführt, mit denen Sie schnell zu verschiedenen Inhalten in einem Dokument oder einer Webseite navigieren können, zusammen mit einigen Fehlerbehebungen, wenn Sie die Sprachausgabe in Windows verwenden.

Navigieren Sie im Scanmodus (Sprachausgabetaste +LEERTASTE) mit der Taste "I" zum nächsten Listenelement und zum vorherigen Listenelement mit der TASTE "UMSCHALT+I". Navigieren Sie beim Lesen langer Tabellen oder Listen mithilfe von ", (Komma)" und "zum Anfang und Ende des Elements. (Punkt)" Schlüssel.

Version veröffentlicht im November 2024

Diese Version dient zur Verbesserung der Gesamtleistung der Sprachausgabe, indem drei neue Sprachausgabeverknüpfungen und einige Fehlerbehebungen in der Sprachausgabe hinzugefügt werden. Wir haben Probleme mit der Leistung der Sprachausgabe nach der erweiterten Verwendung behoben. Diese Verbesserung würde es Ihnen ermöglichen, die Sprachausgabe kontinuierlich zu verwenden, ohne dass sie sich im Laufe der Zeit verlangsamt.

Die Sprachausgabe enthält jetzt einige neue Tastenkombinationen. Mit der Sprachausgabetaste+ STRG+X können Sie den letzten Ausdruck kopieren, den die Sprachausgabe gesprochen hat. Dieser kopierte Ausdruck kann in der Zwischenablage verfügbar sein, damit Sie überall einfügen können, z. B. Teams, Outlook oder ein Word Dokument.

Es gibt auch zwei neue Tastenkombinationen, die dem Scanmodus in der Sprachausgabe hinzugefügt wurden. Wenn Sie den Scanmodus aktivieren, können Sie mit der Verknüpfung "L" direkt zu Listen innerhalb eines Dokuments, einer E-Mail oder webseite navigieren. Eine weitere Scanmodusverknüpfung, "N" , ermöglicht es Ihnen, an einem Block von Links vorbeizuspringen. Dies ist besonders hilfreich, wenn Sie versuchen, zum Hauptinhalt einer Webseite zu gelangen. Um diese beiden Tastenkombinationen auszuprobieren, aktivieren Sie den Scanmodus, indem Sie die Sprachausgabetaste +LEERTASTE drücken.

Mit dieser Version haben wir ein Problem behoben, bei dem die Sprachausgabe automatisch eine "Enthält Stil"-Ankündigung hinzufüge, wenn Text mit Formatierungsattributen wie Aufzählungszeichen und Zahlen in Anwendungen wie Microsoft Edge, Teams und Outlook erkannt wurde.

Außerdem wurde ein Problem behoben, bei dem einige Dialogfelder in der Sprachausgabe die Einstellung für die Textskalierung von 200 % unter Windows nicht übernommen haben.

Die Sprachausgabe beginnt nun mit dem automatischen Lesen der E-Mail, sobald Sie die EINGABETASTE auf dem neuen Outlook Monarch drücken, ähnlich wie beim klassischen Outlook, ohne zum E-Mail-Text navigieren und dann eine separate Verknüpfung zum automatischen Lesen drücken zu müssen.

Version veröffentlicht im August 2024

Diese Version dient zur Verbesserung der Leistung des Scanmodus in der Sprachausgabe. Die Eingabe in Bearbeitungsfelder, z. B. die Adressleiste, ist jetzt einfacher, da der Scanmodus der Sprachausgabe jetzt schneller ausgeschaltet wird. Diese Verbesserung hilft auch beim Ausfüllen von Formularfeldern, z. B. die Eingabe Ihres Namens und Ihrer Adresse in verschiedene Bearbeitungsfelder.

Eine neue Tastenkombination wurde hinzugefügt, um Akku- und Netzwerk-status zu hören. Die neue Tastenkombination ist Sprachausgabetaste +UMSCHALT+B. Dadurch wird angezeigt, ob Ihr Laptop zum Aufladen angeschlossen ist, gefolgt von Akku-status, Netzwerkname und Netzwerk-status.

Einige Beispielankündigungen sind:

  • Akku 79 %, verbleibende Zeit 1 Stunde 48 Minuten, Netzwerkbeispiel Wi-Fi Internetzugriff.

  • Angeschlossen, Akku 23%, Netzwerk Kein Internetzugang.

Version veröffentlicht im Februar 2024

In dieser Version geht es um die Verbesserung der Leseerfahrung für Bilder mit der Sprachausgabe, frühe Schritte bei der Unterstützung des Diktats mit Sprachzugriff und Sprachausgabe, die Möglichkeit, eine Vorschau aller natürlichen Stimmen anzuzeigen und eine Reihe von Fehlerbehebungen in der Sprachausgabe. Um Feedback zu geben , drücken Sie während der Ausführung der Sprachausgabe die Sprachausgabetaste+ALT+F .

Tipp: Die Sprachausgabe-Taste ist eine Zusatztaste in den Befehlen der Sprachausgabe. Sowohl die Feststelltaste als auch die Einfügetaste dienen standardmäßig als Sprachausgabetaste. Weitere Informationen zur Sprachausgabe-Taste finden Sie unter Kapitel 2: Grundlagen der Sprachausgabe oder Anhang B: Tastaturbefehle und Toucheingabegesten für die Sprachausgabe.

Verbessern der Bildnutzung in der Sprachausgabe

Mit der Sprachausgabe haben wir die Bildnutzung verbessert. Es gibt zwei wesentliche Änderungen:

  • Ein neuer Tastaturbefehl wurde hinzugefügt, mit dem Sie zwischen den Grafiken/Bildern auf einer Seite oder einem Bildschirm wechseln können. Jetzt können Sie im Scanmodus (Sprachausgabetaste+LEERTASTE) zwischen Grafiken/Bildern vorwärts oder rückwärts wechseln, indem Sie die Tasten G oder UMSCHALT+G drücken.

  • Die Texterkennung in Bildern wurde verbessert, einschließlich der Handschrifterkennung, und allgemeine Bildbeschreibungen sind besser. Um die verbesserte Erfahrung zu erzielen, navigieren Sie zu einem beliebigen Bild, und führen Sie die Tastaturkombination Sprachausgabe+STRG+D aus, während sich das Bild im Fokus befindet. Für dieses Feature ist eine aktive Internetverbindung erforderlich, und die Einstellungen für die Sprachausgabe müssen die Option haben, bildbeschreibungen aktiviert zu erhalten. Weitere Informationen finden Sie unter Bildbeschreibungen in Kapitel 2: Grundlagen der Sprachausgabe.

Diktieren von Text mit Sprachzugriff

Der Sprachzugriff in Windows 11 ermöglicht es allen Personen, einschließlich Personen mit Mobilitätsbehinderungen, ihren PC zu steuern und Text mit ihrer Stimme zu erstellen. Beispielsweise können Sie Apps öffnen und zwischen diesen wechseln, im Web surfen und E-Mails mit Ihrer Stimme lesen und erstellen. Der Sprachzugriff verwendet eine moderne, geräteinterne Spracherkennung, um Sprache genau zu erkennen und funktioniert auch ohne das Internet. Weitere Informationen finden Sie unter Verwenden des Sprachzugriffs zum Steuern Ihres PCs & Verfassen von Text mit Ihrer Stimme.

Sprachausgabebenutzer können den Sprachzugriff verwenden, um Text mit Stimme zu diktieren und zu hören, was diktiert wird. Darüber hinaus können Sie auch den Sprachzugriff verwenden, um Sprachausgabebefehle zu erteilen. Beispiel: "Sprachausgabe aktivieren", "Schneller sprechen", "Auswahl lesen", "nächste Zeile lesen" usw.

Klicken Sie auf der Sprachzugriffsleiste auf das Hilfesymbol (?) auf der Sprachzugriffsleiste auf Alle Befehle anzeigen , und wählen Sie Sprachausgabebefehle aus, um die gesamte Liste der Sprachausgabebefehle anzuzeigen.

Beachten Sie, dass alle Sprachzugriffsfunktionen nicht mit der Sprachausgabe funktionieren. Weitere Informationen finden Sie im abschnitt unten. Sie können den Sprachzugriff starten, indem Sie in der Windows Search-Leiste suchen oder sie nach dem Öffnen an die Taskleiste anheften.

Was funktioniert:
  • Starten und Einrichten des Sprachzugriffs, der das Herunterladen eines Sprachmodells umfasst.

  • Lesen Sie eine Liste der Sprachzugriffsbefehle und Sprachausgabebefehle aus dem Hilfemenü für den Sprachzugriff.

  • Ändern des Mikrofonzustands für den Sprachzugriff.

  • Text mit Stimme diktieren und zurückhören, was diktiert wurde.

Was funktioniert nicht:
  • Verwenden des Sprachzugriffsleitfadens mit einer Sprachausgabe.

  • Kernfunktionen für den Sprachzugriff: Verwenden verschiedener Sprachzugriffsbefehle, um verschiedene Aufgaben zu erledigen:

    • Verwenden von "Click"-Befehlen oder Zahlenüberlagerungen, um mit bestimmten Elementen auf dem Bildschirm zu interagieren.

    • Verwenden von Rasterüberlagerungen zum Steuern des Mauszeigers.

    • Verwenden von Textbearbeitungsfunktionen wie Korrekturen und Rechtschreibungen im Sprachzugriff.

Tipps: 

  • Sie können ALT+TAB drücken, um durch alle geöffneten Anwendungen zu wechseln, um den Fokus auf die Benutzeroberfläche für den Sprachzugriff zu verschieben.

  • Wenn Sie keine Kopfhörer zum Abhören der Sprachausgabe verwenden, wird die Audioausgabe der Sprachausgabe möglicherweise vom Mikrofon für den Sprachzugriff aufgenommen, was zu unerwünschtem Verhalten führt.

Vorschau natürlicher Stimmen in der Sprachausgabe

Wir haben natürliche Stimmen in 10 neuen Gebietsschemas als Teil des Windows September 2023-Updates eingeführt. Zu diesen natürlichen Stimmen gehören Chinesisch, Spanisch (Spanien), Spanisch (Mexiko), Japanisch, Englisch (UK), Französisch, Portugiesisch, Englisch (Indien), Deutsch und Koreanisch. Mit diesem Windows-Update können Benutzer eine Vorschau anzeigen und die natürliche Stimme hören, bevor sie ein Stimmmodell herunterladen.

Nach dem Herunterladen unterstützen Stimmen der natürlichen Sprachausgabe text-zu-Sprache auf dem Gerät und erfordern keine Internetverbindung. Weitere Informationen finden Sie im Abschnitt natürliche Stimmen in Anhang A: Unterstützte Sprachen und Stimmen.

Hinweise: 

Benötigen Sie weitere Hilfe?

Möchten Sie weitere Optionen?

Erkunden Sie die Abonnementvorteile, durchsuchen Sie Trainingskurse, erfahren Sie, wie Sie Ihr Gerät schützen und vieles mehr.