注: ナレーターのリッチ イメージの説明は、 Windows Insider Program を通じてプレビューで入手できます。
ナレーターの画像の説明では、画像、グラフ、グラフ、図、ラベル付けされていないボタンなどのビジュアル コンテンツの詳細な説明が提供されます。 豊富な画像の説明を使用すると、ブラインド ユーザーは詳細なコンテキストを通じて視覚的なコンテンツを理解できます。 この機能は現在、 Windows Insider Program の Snapdragon 搭載 Copilot+ PC で利用できます。 他の Windows デバイスでは引き続き、オンライン サービスのみに依存する標準のイメージ記述エクスペリエンスが使用されます。
ナレーターは AI モデルを使用して、画像、グラフ、グラフの詳細なテキスト説明を提供します。 ナレーターをオンにすると、 ナレーター キーを押しながら Ctrl キーを押しながら D キーを押して、フォーカスしている画像または項目の説明を取得できます。
たとえば、保育園の画像の説明は次のようになります。
画像は、小さな緑の葉の植物の大きな整理された配置を示しています。これは、きちんとした密なグリッドパターンで並べられた芽や苗である可能性が高いです。 各植物は、保育園や植え付けの設定を示唆する小さな浅い黒い容器の中に含まれています。 植物は均一で整った外観を作り出し、成長organizationやコレクションを象徴しています。 黒い容器は、植物に焦点を当てた緑の芽とは対照的です。
ナレーターの画像の説明は、視覚障碍のあるユーザーや視覚障碍のあるユーザー向けのビジュアル コンテンツのテキスト説明を提供するように設計されています。 説明は、画像、グラフ、グラフの理解を深め、アクセシビリティをサポートすることを目的としています。 イメージの説明を再生成し、後で参照できるように説明をコピーできます。
ナレーターによって生成される説明の品質を確保するために、さまざまな種類のイメージを含むデータ セットが作成されました。 これらの画像には、自然な写真、グラフ、グラフ、スクリーンショット、アプリ のユーザー インターフェイスが含まれていました。 生成された説明は、正確性、完全性、関連性、および有用性について評価されました。 人間の専門家による判断や LLM 支援スコアリングなど、いくつかの評価方法を使用して、生成された説明の品質を向上させる領域を見つけ出しました。
Microsoft は、設計による責任ある AI の作成に取り組んでいます。 私たちの作業は、公平性、信頼性と安全性、プライバシーとセキュリティ、包括性、透明性、説明責任という原則のコア セットによって導かれます。 ナレーターで画像の説明に関するフィードバックを提供操作方法で説明されているいずれかの方法を使用してフィードバックを送信できますか?
ナレーターは、不正確な画像の説明、グラフまたはグラフ内のデータ、または感情的推論を提供する場合があります。 これにより、画像に関する誤った仮定や、生成された説明に基づくビジュアル コンテンツの意図が発生する可能性があります。 ナレーターが使用するモデルに引き続き取り組み、提供される画像の説明の品質を向上させます。この機能は、次の場合には使用しないでください。
-
医療や健康に関連する画像の説明を生成します。これは、医療上のアドバイスとして誤って解釈される可能性があります。 説明が正しくないと、誤った情報が表示され、ユーザーが有害な判断を下す可能性があります。
-
正確さが重要な法的または財務文書の画像の説明を生成します。 このような画像を誤って解釈すると、法的な紛争や金銭的損失につながる可能性があります
-
適切なコンテキストを持たない文化的または宗教的なシンボルを含む画像の説明を生成します。 誤解は、文化的な無感感や犯罪につながる可能性があります。
-
マップ、フラグ、または地球儀を含むイメージの説明を生成します。 これらの画像を誤って解釈すると、情報の誤りや国際問題への関与につながる可能性があります。
ナレーターがオンのときに画像の説明を取得するには、ビジュアル コンテンツに焦点を当てながら 、ナレーター キーを押しながら Ctrl キーを押しながら D キーを押します。 ナレーターで画像の説明をオフにするには、[ 設定] > [ アクセシビリティ ] > [ ナレーター ] > [ 画像の説明、ページ タイトル、および一般的なリンクを取得 する] に移動し、トグル スイッチを選択します。
ナレーターが提供する説明に不正確な情報が含まれている可能性があります。 説明の品質を向上させるには、次の方法でフィードバックを提供できます。
-
ナレーター ユーザー インターフェイスの画像の説明でサムアップまたはサムダウン アイコンを選択します。
-
Windows から、使用する製品またはサービスに関する評価または書面によるフィードバックの提供を求めるメッセージが表示される場合があります。
-
フィードバック Hub を開いて、同様のフィードバックを見つけたり、フォームに入力して新しいフィードバックを提供したりします。
責任ある AI とプライバシーに対する Microsoft の取り組み
Microsoft は、2017 年に初めて AI の原則を定義し、その後、責任ある AI 標準を通じて当社のアプローチを運用可能にしており、それ以来、責任を持って AI の進展に取り組んでいます。 AI システムの開発と展開においては、プライバシーとセキュリティが主要な原則です。 私たちは、お客様が当社の AI 製品を責任を持って使用できるように支援し、当社の学びを共有し、信頼に基づくパートナーシップを構築できるよう取り組んでいます。 責任ある AI への当社の取り組み、当社の指針となる原則、および責任を持った AI テクノロジの開発を保証にするために作成したツールと機能の詳細については、「責任ある AI」を参照してください。
ナレーターの豊富な画像の説明は、視覚障疵や視覚障疵のあるユーザーのアクセシビリティを向上させるために設計されており、より多くのユーザーを対象としたものではありません。 この機能の AI モデルでは、背景の人物やエンティティなど、画像全体でコンテキスト キューが使用されます。これは、モデルが画像を個人に関連付けたり、感情を記述したりする方法です。 ナレーターの豊富な画像の説明では、感情推論は可能ですが、生体認証データは使用しません。 個人を識別する結果を返す処理や、個人の感情を推測する処理は、顔認識、顔テンプレートの生成、比較など、顔の処理の結果ではありません。 たとえば、チームのジャージを着た人気のあるアスリートの写真と特定の数が画像に含まれている場合、モデルは、それらのコンテキストキューに基づいて個人を識別する可能性のある結果を返す可能性があります。
この機能は、職場や教育機関 (従業員や学生など) の自然人の感情を推測または推測するために使用しないでください。 ナレーターの画像の説明では、画像内のユーザーの感情に関連する詳細なテキスト説明を提供できます。 人間の感情の根底にあるプロセスは複雑であり、感情を知覚、経験、表現する方法に影響を与える文化的、地理的、個人の違いがあります。 画像内の人々の感情に関連する応答は、それらがどのように表示されるかに基づいており、必ずしも個々の人々の内部状態を正確に示しているとは限りません。
公開日: 2025 年 2 月 11 日
最終更新日: 2025 年 2 月 11 日