Часто задаваемые вопросы о расширенных описаниях изображений в экранном дикторе

Примечание: Подробные описания изображений в экранном дикторе доступны в предварительной версии в рамках программы предварительной оценки Windows.

Описания изображений в экранном дикторе содержат подробные описания визуального содержимого, например изображений, диаграмм, диаграмм, диаграмм, схем, кнопок без меток и т. д. Расширенные описания изображений позволяют незрячим пользователям понимать визуальное содержимое с помощью подробного контекста. Эта функция в настоящее время доступна на компьютерах Copilot+ на платформе Snapdragon в рамках программы предварительной оценки Windows. Другие устройства Windows по-прежнему будут использовать стандартный интерфейс описания образа, который зависит исключительно от веб-службы.

Экранный диктор использует модели ИИ для предоставления подробных текстовых описаний изображений, диаграмм и графов. Когда экранный диктор включен, можно нажать клавиши экранного диктора+CTRL+D , чтобы получить описание изображения или элемента, на который вы сосредоточены.

Например, описание изображения питомника будет следующим:

На изображении изображено большое организованное расположение мелких зеленых листовых растений, которые, вероятно, являются ростками или саженцы, расположенными в аккуратном плотном шаблоне сетки. Каждое растение содержится в небольшом мелком черном контейнере, предлагая питомник или установку посадки. Растения равномерно расставляются, создавая единообразный и упорядоченный внешний вид, который может символизировать рост организации или коллекции. Черные контейнеры обеспечивают резкий контраст с зелеными ростками, подчеркивая акцент на растениях.

Описания изображений в экранном дикторе предназначены для предоставления текстовых описаний визуального содержимого для слепых или слабовидящих. Описания предназначены для улучшения понимания изображений, диаграмм и графиков, а также для поддержки специальных возможностей. Вы можете повторно создать описание изображения и скопировать его для дальнейшего использования.

Чтобы обеспечить качество описаний, создаваемых экранным диктором, был создан набор данных, включающий различные типы изображений. Эти изображения включали естественные фотографии, диаграммы, графики, снимки экрана и пользовательские интерфейсы приложения. Созданные описания были оценены на предмет точности, полноты, релевантности и полезности. Для поиска областей для улучшения качества создаваемых описаний использовались несколько методов оценки, включая экспертные суждения человека и оценку с помощью LLM.

Корпорация Майкрософт стремится к созданию ответственного искусственного интеллекта. Наша работа руководствуется основным набором принципов: справедливости, надежности и безопасности, конфиденциальности и безопасности, инклюзивности, прозрачности и подотчетности. Экранный диктор может предоставлять неточное описание изображения, данные в диаграммах или диаграммах или эмоциональные выводы. Это может привести к неверным предположениям о изображении или намерению визуального содержимого на основе созданного описания. Мы продолжаем работать над моделями, используемыми экранным диктором для улучшения качества предоставленных описаний изображений. Вы можете отправить отзыв с помощью любого из методов, описанных в Разделы справки предоставить отзыв об описаниях изображений в экранном дикторе?

Эту функцию не следует использовать для:

создавать описания медицинских изображений или изображений, связанных со здоровьем, которые могут быть неправильно истолкованы как медицинские советы. Неправильные описания могут привести к дезинформации и потенциально вредным решениям со стороны пользователей.
создавать описания изображений в юридических или финансовых документах, где точность имеет решающее значение. Неправильное толкование таких изображений может привести к судебным спорам или финансовым потерям
создание описаний для изображений, содержащих культурные или религиозные символы без надлежащего контекста. Неправильное толкование может привести к культурной бесчувственности или правонарушению.
создание описаний для изображений, содержащих карты, флаги или глобусы. Неправильное толкование этих изображений может привести к дезинформации и участию в международных делах.

Чтобы получить описание изображения, когда экранный диктор включен, нажимайте клавиши экранного диктора+CTRL+D , фокусируясь на визуальном содержимом. Чтобы отключить описания изображений в экранном дикторе, перейдите в раздел Параметры > Специальные возможности > экранного диктора > Получение описаний изображений, заголовков страниц и популярных ссылок и выберите переключатель.

В описаниях, которые предоставляет экранный диктор, могут быть неточности. Чтобы улучшить качество описаний, вы можете предоставить отзыв, выполнив следующие действия:

Выбор значка с большими пальцами вверх или вниз в описании изображения в пользовательском интерфейсе экранного диктора.
Отвечая на случайные запросы из Windows с просьбой оценить или предоставить письменный отзыв о продукте или службах, которые вы используете.
Откройте Центр отзывов , чтобы найти аналогичные отзывы для отправки или предоставления новых отзывов, заполнив форму.

Обязательства Майкрософт в области ответственного применения ИИ и конфиденциальности

Майкрософт работает над ответственным развитием ИИ с 2017 года, когда мы впервые определили наши принципы в области ИИ, а затем ввели в действие наш подход с помощью Стандарта ответственного применения ИИ. Конфиденциальность и безопасность — главные принципы для нас при разработке и развертывании систем ИИ. Мы работаем над тем, чтобы помочь нашим клиентам ответственно использовать наши продукты ИИ, делимся накопленным опытом и строим доверительные партнерские отношения. Дополнительные сведения о наших усилиях в области ответственного применения ИИ, принципах, которыми мы руководствуемся, а также об инструментах и возможностях, которые мы создали для обеспечения ответственной разработки технологий ИИ, см. в разделе Ответственное применение ИИ.

Подробное описание изображения в экранном дикторе предназначено для повышения доступности для незрячих и слабовидящих пользователей и не предназначено для более широкой аудитории. Модели ИИ для этой функции используют контекстные подсказки во всем изображении, включая людей или сущностей в фоновом режиме. Таким образом, модели по-прежнему могут связывать изображение с отдельным пользователем или описывать эмоции. Подробные описания изображений в экранном дикторе позволяют делать эмоциональные выводы, но не используют биометрические данные. Любая обработка, которая возвращает результаты, которые идентифицируют человека или вывод, что его эмоции не являются результатом обработки лица, например распознавание лиц, создание и сравнение шаблонов лиц. Например, если изображение содержит фотографию популярного спортсмена в майке своей команды и его конкретный номер, модели могут по-прежнему возвращать результат, который может идентифицировать человека на основе этих контекстных подсказок.

Эта функция не должна использоваться для вывода или вывода эмоций физических лиц на рабочем месте или в образовательных учреждениях (например, работников или студентов). Описание изображения в экранном дикторе может предоставлять подробные текстовые описания, связанные с воспринимаемыми эмоциями людей на изображениях. Процессы, лежащие в основе человеческих эмоций, сложны, и существуют культурные, географические и индивидуальные различия, которые влияют на то, как мы можем воспринимать, испытывать и выражать эмоции. Ответы, связанные с эмоциями людей на изображениях, основаны на том, как они появляются и не обязательно точно указывают на внутреннее состояние отдельных людей.

Опубликовано: 11 февраля 2025 г.

Последнее обновление: 11 февраля 2025 г.

Часто задаваемые вопросы о расширенных описаниях изображений в экранном дикторе

Обязательства Майкрософт в области ответственного применения ИИ и конфиденциальности

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Были ли сведения полезными?

Спасибо за ваш отзыв!

Что такое расширенные описания изображений в экранном дикторе?

Как работают многофункциональные описания изображений в экранном дикторе?

Для чего можно использовать расширенные описания изображений в экранном дикторе?

Как были оценены подробные описания изображений в экранном дикторе? Какие метрики использовались для измерения производительности?

Какие операционные факторы и параметры позволяют эффективно и ответственно использовать расширенные описания изображений в экранном дикторе?

Разделы справки предоставить отзыв о расширенных описаниях изображений в экранном дикторе?

Обязательства Майкрософт в области ответственного применения ИИ и конфиденциальности

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Были ли сведения полезными?

Спасибо за ваш отзыв!