Perguntas frequentes sobre descrições de imagem avançadas no Narrador

Observação: As descrições de imagens avançadas no Narrador estão disponíveis em pré-visualização através do Programa Windows Insider.

As descrições de imagens no Narrador fornecem descrições detalhadas de conteúdos visuais, tais como imagens, gráficos, diagramas, botões não etiquetados e muito mais. As descrições de imagens avançadas permitem que os utilizadores invisuais compreendam os conteúdos visuais através de contexto detalhado. Esta funcionalidade está atualmente disponível em PCs Copilot+ com tecnologia Snapdragon no Programa Windows Insider. Outros dispositivos Windows continuarão a utilizar a experiência de descrição da imagem padrão, que depende apenas de serviços online.

O Narrador utiliza modelos de IA para fornecer descrições textuais detalhadas de imagens, gráficos e gráficos. Quando o Narrador está ativado, pode premir a tecla Narrador+Ctrl+D para obter uma descrição da imagem ou item em que está focado.

Por exemplo, a descrição de uma imagem de um berçário seria:

A imagem retrata uma grande disposição organizada de pequenas plantas folhadas verdes que são provavelmente brotos ou sementes dispostas em um padrão de grelha densa puro. Cada planta está contida num pequeno contentor preto raso que sugere um viveiro ou uma configuração de plantação. As plantas estão uniformemente espaçados criando um aspeto uniforme e ordenado que pode simbolizar uma organização de crescimento ou uma coleção. Os contentores pretos proporcionam um contraste gritante com os brotos verdes que realçam o foco nas plantas.

As descrições de imagens no Narrador foram concebidas para fornecer descrições de texto de conteúdo visual para pessoas invisuais ou com dificuldades de visão. As descrições destinam-se a melhorar a sua compreensão de imagens, gráficos e gráficos e a suportar a acessibilidade. Pode regenerar a descrição da imagem e copiar a descrição para referência futura.

Para garantir a qualidade das descrições geradas pelo Narrador, foi criado um conjunto de dados que inclui vários tipos de imagens. Estas imagens incluíam fotografias naturais, gráficos, gráficos, capturas de ecrã e interfaces de utilizador de aplicações. As descrições geradas foram avaliadas quanto à precisão, à exatidão, à relevância e à utilidade. Vários métodos de avaliação, incluindo julgamentos de peritos humanos e classificação assistida por LLM, foram utilizados para encontrar áreas para melhorar a qualidade das descrições geradas.

A Microsoft está empenhada em criar IA responsável por predefinição. O nosso trabalho é orientado por um conjunto fundamental de princípios: justiça, fiabilidade e segurança, privacidade e segurança, inclusão, transparência e responsabilidade. O Narrador pode fornecer uma descrição de imagem imprecisa, dados em gráficos ou inferências emocionais. Isto pode levar a pressupostos incorretos sobre uma imagem ou a intenção de conteúdo visual com base na descrição gerada. Continuamos a trabalhar nos modelos que o Narrador utiliza para melhorar a qualidade das descrições de imagens fornecidas. Pode submeter comentários através de qualquer um dos métodos abordados no Como fazer fornecer feedback sobre descrições de imagens no Narrador?

Esta funcionalidade não deve ser utilizada para:

gerar descrições para imagens médicas ou relacionadas com a saúde que podem ser mal interpretadas como aconselhamento médico. Descrições incorretas podem levar à desinformação e a decisões potencialmente prejudiciais por parte dos utilizadores.
gerar descrições para imagens em documentos legais ou financeiros em que a precisão é fundamental. A interpretação errada dessas imagens pode levar a litígios legais ou perdas financeiras
gerar descrições para imagens que contenham símbolos culturais ou religiosos sem contexto adequado. A má interpretação pode levar à insensibilidade cultural ou ofensa.
gerar descrições para imagens que contenham mapas, sinalizadores ou globos. A interpretação errada destas imagens pode levar à desinformação e ao envolvimento nos assuntos internacionais.

Para obter uma descrição da imagem quando o Narrador está ativado, prima a tecla Narrador+Ctrl+D enquanto se concentra no conteúdo visual. Para desativar as descrições de imagens no Narrador, aceda a Definições > Acessibilidade > Narrador > Obter descrições de imagens, títulos de página e ligações populares e selecione o botão de alternar.

Podem existir imprecisões nas descrições que o Narrador fornece. Para melhorar a qualidade das descrições, pode fornecer feedback ao:

Selecionar o ícone polegar para cima ou polegar para baixo numa descrição de imagem na interface de utilizador do Narrador.
Responder a pedidos ocasionais do Windows a pedir-lhe para classificar ou fornecer comentários escritos sobre o produto ou serviços que utiliza.
Abrir o Hub de Comentários para encontrar comentários semelhantes para fazer votos a favor ou dar novos comentários ao preencher o formulário.

O compromisso da Microsoft com a IA responsável e com a privacidade

A Microsoft vem trabalhando para avançar a IA com responsabilidade desde 2017, quando definimos pela primeira vez nossos princípios de IA e, posteriormente, operacionalizamos nossa abordagem por meio de nosso Padrão de IA Responsável. Privacidade e segurança são princípios fundamentais ao desenvolver e implantar sistemas de IA. Trabalhamos para ajudar nossos clientes a usar nossos produtos de IA com responsabilidade, compartilhando nossos aprendizados e criando parcerias baseadas em confiança. Para saber mais sobre nossos esforços de IA responsável, os princípios que nos guiam e as ferramentas e funcionalidades que criamos para garantir que desenvolvamos a tecnologia de IA de forma responsável, confira IA Responsável.

A descrição de imagens avançadas no Narrador foi concebida para melhorar a acessibilidade para utilizadores invisuais e de visão reduzida e não se destina a um público mais vasto. Os modelos de IA para esta funcionalidade utilizam ajudas contextuais em toda a imagem, incluindo pessoas ou entidades em segundo plano, que é a forma como os modelos ainda podem associar a imagem a um indivíduo ou descrever emoções. As descrições de imagens avançadas no Narrador permitem inferências emocionais, mas não utilizam dados biométricos. Qualquer processamento que devolva resultados que identifiquem um indivíduo ou inferam a emoção de um indivíduo não é o resultado do processamento do rosto, como o reconhecimento facial, a geração e a comparação de modelos faciais. Por exemplo, se uma imagem contiver uma fotografia de um atleta popular com a camisola da sua equipa e o seu número específico, os modelos ainda poderão devolver um resultado que possa identificar o indivíduo com base nessas ajudas contextuais.

Esta funcionalidade não deve ser utilizada para inferir ou deduzir as emoções das pessoas naturais no local de trabalho ou nas instituições de ensino (por exemplo, funcionários ou estudantes). A descrição da imagem no Narrador pode fornecer descrições detalhadas de texto relacionadas com emoções percebidas de pessoas em imagens. Os processos subjacentes à emoção humana são complexos e existem diferenças culturais, geográficas e individuais que influenciam a forma como podemos perceber, experimentar e expressar emoções. As respostas relacionadas com as emoções das pessoas nas imagens baseiam-se na forma como aparecem e podem não indicar necessariamente com precisão o estado interno das pessoas individuais.

Publicado em: 11 de fevereiro de 2025

Última atualização: 11 de fevereiro de 2025

Perguntas frequentes sobre descrições de imagem avançadas no Narrador

O compromisso da Microsoft com a IA responsável e com a privacidade

Precisa de mais ajuda?

Quer mais opções

Essas informações foram úteis?

Agradecemos seus comentários!

O que são descrições de imagens avançadas no Narrador?

Como funcionam as descrições de imagens avançadas no Narrador?

Para que podem ser utilizadas descrições de imagens avançadas no Narrador?

Como foram avaliadas as descrições de imagens avançadas no Narrador? Que métricas foram utilizadas para medir o desempenho?

Quais são as limitações das descrições de imagens avançadas no Narrador e como é que os utilizadores podem minimizar o impacto destas limitações ao utilizar o sistema?

Que fatores operacionais e definições permitem uma utilização eficaz e responsável de descrições de imagens avançadas no Narrador?

Como fazer fornecer feedback sobre descrições de imagens avançadas no Narrador?

O compromisso da Microsoft com a IA responsável e com a privacidade

Precisa de mais ajuda?

Quer mais opções

Essas informações foram úteis?

Agradecemos seus comentários!