ライブ キャプションを使用してオーディオの理解を深める

ライブ キャプションは、聴覚障碍のあるユーザーや難聴者を含むすべてのユーザーが、自動文字起こしを提供することでオーディオをよりよく理解するのに役立ちます。

より多くのユーザーがより多くのコンテンツにアクセスできるようにするために、ライブ キャプションは翻訳を提供する機能を備え、PC を通過するすべてのオーディオを単一のキャプションエクスペリエンスに変えます。  Copilot+ PCを使用する場合、ライブ キャプションは、40 以上の言語から英語に、27 の言語から中国語 (簡体字) に、任意のアプリまたはビデオ プラットフォームでライブまたは事前に記録されたビデオを即座に翻訳します。

ライブ キャプションはWindows 11全体で機能するため、他のアプリで作業しているときにキャプションをシームレスに読み取ります。 キャプションは、インターネットから切断された場合でもオーディオ用に提供できます。 キャプションの表示方法をカスタマイズしたり、マイク オーディオを含めれば、会話を簡単にできます。

重要

オーディオの処理と、検出された音声データからのキャプションの生成はすべて、デバイス上で行われます。 オーディオ、音声データ、キャプションはデバイスから離れることはなく、クラウドや Microsoft と共有されません。 生成されたキャプションは、デバイスまたはクラウド上のどこにも保存されません。 詳細については、 Microsoft のプライバシーに関する声明を参照してください。 

注: 

ライブ キャプションは、バージョン 22H2 以降のWindows 11で利用できます。 翻訳機能は、バージョン 24H2 以降Windows 11実行されている Copilot+ PC で使用できます。 Windows 11の新機能の詳細については、「最近の Windows 更新プログラムの新機能」を参照してください。

使用している Windows のバージョンがわからない場合は、 「Windows バージョンを検索する」を参照してください。

この記事の内容

ライブ キャプションを有効にする

ライブ キャプションを有効にするには、次のいずれかの操作を行います。

  • クイック設定で ライブ キャプション をオンにします (クイック設定を開くには、タスク バーのバッテリー、ネットワーク、またはボリューム アイコンを選択します)。
  • クイック設定の [アクセシビリティ] ポップアップで [ ライブ キャプション ] トグル オンにします。
  • Windows ロゴwindowslogo キーを押しながら Ctrl + L キーを押します。
  • [ Start>All apps>Accessibility>Live captions] を選択します。
  • [設定>アクセス>Captions] に移動し、[ライブ キャプション] トグルをオンにします。

初めてオンにすると、ライブ キャプションによって、デバイス上の音声データを処理するための同意が求められ、デバイス上の音声認識で使用される言語ファイルをダウンロードするように求められます。 言語が使用できない場合は、セットアップ中に別の言語を使用できます。

Copilot+ PCを使用する場合、ライブ キャプションに加えて、英語 (米国) または中国語 (簡体字) を出力言語として使用すると、翻訳も自動的に表示されます。 ライブ キャプションでは、 40 以上の言語を 英語に、 27 言語を 中国語 (簡体字) に翻訳できます。

キャプションの表示方法をカスタマイズする

デスクトップにキャプションを表示する場所を選択するには:

  1. ライブ キャプション ウィンドウで [設定] ボタンを選択します。

  2. [ 位置] を選択します

  3. [画面の上]、[画面の下]、または [画面のオーバーレイ] のいずれかを選択します。

    • [画面の上] または [画面の下] を選択すると、キャプション ウィンドウがデスクトップ上の予約領域の上部または下部の画面の端にドッキングされているように表示され、他のアプリはキャプション ウィンドウによってブロックされません。 上部にドッキングすると、仮想会議や会話でビデオを共有しているときにライブ キャプションがうまく機能するのに対し、ビデオの表示などの場合は、一番下にドッキングするのが最適な場合があります。
    • [画面にフローティング] を選択すると、ライブ キャプションがオーバーレイ ウィンドウに表示されます。このウィンドウは、必要に応じて再配置して、使用中の他のアプリを隠さないようにすることができます。

キャプション ウィンドウにさらに多くの行のテキストを表示するには、マウス、タッチ、またはキーボードを使用してウィンドウ サイズを大きくします。

キャプションを読みやすくする

  1. ライブ キャプション ウィンドウで [設定] ボタンを選択します。

  2. [ 基本設定] を選択します

  3. [ キャプション スタイル] を選択します。 [キャプション] の [アクセシビリティ] 設定が開きます。

  4. [ キャプション スタイル] で、次のいずれかの操作を行います。

    • ドロップダウン メニューから組み込みのスタイルを選択します。 既定の組み込みスタイルを使用して、[設定]>Personalization>Colors>モードを選択して、デバイスのダーク モードまたはライト モードの設定に適した色でキャプションを表示します
    • [ 編集 ] ボタンを選択して、最適なカスタム スタイルを作成します。

マイクを使用して音声をキャプションする

PC のマイクを使用して、独自の音声をキャプションすることもできます。 この機能がオンの場合、デバイス上の他のオーディオにキャプションが付かっていない場合、マイクによってキャプチャされたすべてのオーディオにキャプションが付けられます。 たとえば、他のユーザーとのオンライン会議中にライブ キャプションを使用する場合、互いに話し合うと、他のユーザーのキャプションのみが表示されます。 

オーディオの処理と、検出された音声データからのキャプションの生成はすべて、デバイス上で行われます。 オーディオ、音声データ、キャプションはデバイスから離れることはなく、クラウドや Microsoft と共有されません。 生成されたキャプションは、デバイスまたはクラウド上のどこにも保存されません。 詳細については、 Microsoft のプライバシーに関する声明を参照してください。 

独自の音声をキャプションするには:

  1. ライブ キャプション ウィンドウで [設定] ボタンを選択します。
  2. [ 基本設定] を 選択し、[ マイクオーディオを含める ] オプションをオンにします。 ライブ キャプションを有効にすると、この機能は既定でオフになります。

デバイスのマイク構成をチェックするには、「設定>System>Sound」を参照し、入力オプションを確認します。 

ライブ キャプションによるマイクの使用に合わせてプライバシー設定を調整するには、[設定>Privacy & security>Microphone>アプリがマイクにアクセスできるようにする>デスクトップ アプリがマイクにアクセスできるようにするに移動します。 マイクのプライバシーの詳細については、「 マイクのプライバシー」を参照してください。

他の言語を追加して使用する

他の言語を追加するには:

  • ライブ キャプション ウィンドウで [設定] ボタンを選択します。
  • [ 言語の変更] を選択し、ドロップダウンから目的の言語を選択し、[続行] を選択 します
  • 言語がまだダウンロードされていない場合は、ダウンロードするように求められます。 [ ダウンロード ] を選択して確定します。
  • ダウンロードが完了すると、新しい言語でキャプションする準備ができているライブ キャプションが表示されます。

ヒント

デバイスに既にインストールされている言語は、言語選択ドロップダウンで 太字 で強調表示されています。

ライブ キャプションを最大限に活用する

使用しているコントロールを理解するのに役立つ、最適なエクスペリエンスを得るその他の方法を次に示します。

  • 不適切な表現を隠すには、[設定] 設定メニューに移動し、[基本設定] を選択し、[不適切な表現のフィルター] オプションをオンにします。

  • マイクを使用するときのキャプションの精度を向上させるには、環境内のバックグラウンド ノイズを最小限に抑え、マイクに直接読み込んでください。

  • キャプションの遅延を最小限に抑えるために、またはキャプションが表示されていないことに気付いた場合は、使用されていないアプリを閉じてパフォーマンスを最大化してください。

    • リソースを集中的に使用するアプリ (ビデオを共有するアプリなど) は、ライブ キャプションのリアルタイム動作に影響を与え、キャプションの遅延やキャプションの削除につながる可能性があります。 このような場合は、ライブ キャプションに応じて一部のアプリ機能を制限することを検討してください (たとえば、共有ビデオに適用されている背景効果やその他の特殊効果をオフにします)。

責任ある AI に対する Microsoft のコミットメント

ライブ キャプションは、プライバシーを念頭に置いて責任を持って構築されています。 これは、デバイス上の言語ファイルとデータを保持し、マイクを既定でオフにし、不適切な音声要素をマスクするためのオプションの不適切なフィルターを提供します。 これに加えて、翻訳を含むライブ キャプションは、言語とアクセントの障壁を破るためにライブ キャプションの機能を拡張します。

ライブ キャプションでは、クラウドベースの Speech to Text API と同じ公平性データセットで評価されるキャプション言語ファイルのコンパクト バージョンである、Azure AI 音声 モデルが使用されます。 これらのモデルはデバイスに埋め込まれており、合理的で許容できる精度で合理化されたローカルキャプションと翻訳をリアルタイムで提供します。 AZURE AI Speech の責任ある使用の詳細については、「音声からテキストへの公平性の情報」および「透明性に関するメモ」および「テキストへの音声のユース ケース」を参照してください。

責任ある AI の取り組み、指針となる原則、および責任を持って AI テクノロジを開発するために作成したツールと機能の詳細については、「 責任ある AI」を参照してください。

ご意見をお聞かせください。

気に入っているものがあり、特に気に入らないものがある場合は、ライブ キャプションに関して フィードバック Hub を使用してフィードバックを送信できます (ライブ キャプションがアクティブになっているときに Windows ロゴwindowslogo キーを押しながら F キーを押します)、[ アクセシビリティ>Live キャプション カテゴリ] を選択します。 

よく寄せられる質問

ライブ キャプションでサポートされている言語は何ですか?

ライブ キャプションでは、次の音声認識がサポートされています。

  • 中国語 (簡体字、中国)
  • 中国語 (繁体字、香港特別行政区)
  • 中国語 (繁体字、台湾)
  • デンマーク語
  • 英語 (オーストラリア)
  • 英語 (カナダ)
  • 英語 (インド)
  • 英語 (アイルランド)
  • 英語 (ニュージーランド)
  • 英語 (英国)
  • 英語 (米国)
  • フランス語 (カナダ)
  • フランス語 (フランス)
  • ドイツ語 (ドイツ)
  • イタリア語 (イタリア)
  • 日本語
  • 韓国語
  • ポルトガル語 (ブラジル)
  • ポルトガル語 (ポルトガル)
  • スペイン語 (メキシコ)
  • スペイン語 (スペイン)

ライブ キャプションはどの言語で英語に翻訳されますか?

Copilot+ PCでは、ライブ キャプションでは、次の言語から英語に翻訳できます。

  • アラビア語
  • バスク語
  • ボスニア語
  • ブルガリア語
  • 中国語 (広東語)
  • 中国語 (中国語)
  • 中国語 (簡体字、中国)
  • チェコ語
  • デンマーク語
  • オランダ語
  • 英語
  • エストニア語
  • フィンランド語
  • フランス語
  • ガリシア語
  • ドイツ語
  • ギリシア語
  • ヒンディー語
  • ハンガリー語
  • インドネシア語
  • アイリッシュ
  • イタリア語
  • 日本語
  • 韓国語
  • ラトビア語
  • リトアニア語
  • マケドニア語
  • マルタ語
  • ノルウェー語
  • パシュトゥー語
  • ポーランド語
  • ポルトガル語
  • ルーマニア語
  • ロシア語
  • スロバキア語
  • セルビア語
  • スロベニア語
  • ソマリ語
  • スペイン語
  • スウェーデン語
  • タイ語
  • トルコ語
  • ウクライナ語
  • ベトナム語
  • ウェールズ語

ライブ キャプションが中国語に翻訳される言語は何ですか?

  • アラビア語
  • ブルガリア語
  • チェコ語
  • デンマーク語
  • ドイツ語
  • ギリシア語
  • 英語
  • エストニア語
  • フィンランド語
  • フランス語
  • ヒンディー語
  • ハンガリー語
  • イタリア語
  • 日本語
  • 韓国語
  • リトアニア語
  • ノルウェー語
  • オランダ語
  • ポーランド語
  • ポルトガル語
  • ルーマニア語
  • ロシア語
  • スロバキア語
  • スロベニア
  • スペイン語
  • スウェーデン語
  • トルコ語

キャプションを付けることができるオーディオの種類は何ですか?

音声で検出された音声のみがキャプション付けされます。 拍手や音楽などの可聴イベントは検出されません。 音楽で歌われる歌詞は確実に検出されません。

ライブ キャプションはデータをどのように処理して使用しますか?

オーディオの処理と、検出された音声データからのキャプションの生成はすべて、デバイス上で行われます。 オーディオ、音声データ、キャプションはデバイスから離れることはなく、クラウドや Microsoft と共有されません。 生成されたキャプションは、デバイスまたはクラウド上のどこにも保存されません。 詳細については、 Microsoft のプライバシーに関する声明を参照してください。 

会議でヘッドセットを使用していますが、ライブ キャプションがオーディオのキャプションになっていないのはなぜですか?

ライブ キャプションは、設定>System>Sound で構成された既定のサウンド出力デバイスに注意を払います。 オーディオをライブ キャプションで取得するには、既定のデバイスを変更する必要がある場合があります。

ライブ キャプションでマイクの設定設定が記憶されないのはなぜですか?

ライブ キャプションが起動すると、マイクは常に既定でオフになるため、意図したオーディオのみがキャプションされます。

マイクオーディオがサウンドオーディオと同時にキャプチャされるとどうなりますか? 表示されるオーディオのキャプション

サウンド オーディオはマイク オーディオよりも優先されます。 たとえば、リモート会議参加者が話している仮想会議に参加していて、互いに話し合っている場合、リモート会議参加者のキャプションは自分の代わりに表示されます。

ライブ キャプションを初めて実行したときにダウンロード エラーが発生します。これを解決するにはどうすればよいですか?

「ライブ キャプションまたは音声アクセス設定の問題のトラブルシューティング」を参照してください。 

ライブ キャプションを使用しなくなりましたが、ダウンロードされた言語ファイルを削除してストレージ領域を解放するにはどうすればよいですか?

[設定>Apps>インストールされているアプリ] に移動し、Speech Pack を検索します。 インストールされているすべての言語ファイルの一覧が表示されます。 アンインストールする言語ファイルの [その他] メニューから [アンインストール] を選択します。

ライブ キャプションまたは音声アクセスの設定に関する問題のトラブルシューティング