Obs!: Avancerade bildbeskrivningar i Skärmläsaren är tillgängliga i förhandsversionen av Windows Insider Program.
Bildbeskrivningar i Skärmläsaren ger detaljerade beskrivningar av visuellt innehåll, till exempel bilder, diagram, diagram, oetiketterade knappar och mycket mer. Beskrivningar av avancerade bilder gör det möjligt för blinda användare att förstå visuellt innehåll via ett detaljerat sammanhang. Den här funktionen är för närvarande tillgänglig på Snapdragon-drivna Copilot+-datorer i Windows Insider Program. Andra Windows-enheter fortsätter att använda standardbildens beskrivningsupplevelse, som endast är beroende av onlinetjänster.
Skärmläsaren använder AI-modeller för att ge detaljerade textbeskrivningar av bilder, diagram och grafer. När Skärmläsaren är aktiverad kan du trycka på Skärmläsartangenten + Ctrl + D för att få en beskrivning av bilden eller objektet som du är fokuserad på.
Beskrivningen av en bild av en barnkammare skulle till exempel vara:
Bilden visar ett stort organiserat arrangemang av små gröna lummiga växter som sannolikt groddar eller plantor ordnade i ett snyggt tätt rutnätmönster. Varje växt finns i en liten grund svart behållare som föreslår en plantskola eller en planteringsanläggning. Växterna är jämnt fördelade och skapar ett enhetligt och ordnat utseende som kan symbolisera tillväxtorganisation eller en samling. De svarta behållarna ger en stark kontrast till de gröna groddarna som lyfter fokus på växterna.
Bildbeskrivningar i Skärmläsaren är utformade för att ge textbeskrivningar av visuellt innehåll för personer som är blinda eller har nedsatt syn. Beskrivningarna är avsedda att förbättra din förståelse av bilder, diagram och grafer samt stöd för hjälpmedel. Du kan återskapa bildbeskrivningen och kopiera beskrivningen för framtida referens.
För att säkerställa kvaliteten på beskrivningar som genereras av Skärmläsaren har en datauppsättning med olika typer av bilder skapats. Dessa bilder inkluderade naturliga fotografier, diagram, grafer, skärmbilder och appanvändargränssnitt. De genererade beskrivningarna utvärderades för noggrannhet, fullständighet, relevans och användbarhet. Flera utvärderingsmetoder, inklusive mänskliga expertbedömningar och LLM-assisterad poängsättning, användes för att hitta områden för att förbättra kvaliteten på genererade beskrivningar.
Microsoft strävar efter att skapa ansvarsfull AI efter design. Vårt arbete styrs av en grundläggande uppsättning principer: rättvisa, tillförlitlighet och säkerhet, sekretess och säkerhet, inkluderande, transparens och ansvarsskyldighet. Hur gör jag för att ge feedback på bildbeskrivningar i Skärmläsaren?
Skärmläsaren kan ge felaktiga bildbeskrivningar, data i diagram eller grafer eller känslomässiga slutsatser. Detta kan leda till felaktiga antaganden om en bild eller avsikten med visuellt innehåll baserat på den genererade beskrivningen. Vi fortsätter att arbeta med de modeller som Skärmläsaren använder för att förbättra kvaliteten på bildbeskrivningarna. Du kan skicka feedback med någon av de metoder som diskuteras iDen här funktionen ska inte användas för att:
-
för medicinska eller hälsorelaterade bilder som kan tolkas som medicinsk rådgivning. Felaktiga beskrivningar kan leda till felaktig information och potentiellt skadliga beslut av användare.
-
skapa beskrivningar för bilder i juridiska eller ekonomiska dokument där riktigheten är kritisk. Feltolkning av sådana bilder kan leda till rättsliga tvister eller ekonomiska förluster
-
skapa beskrivningar för bilder som innehåller kulturella eller religiösa symboler utan ordentlig kontext. Feltolkning kan leda till kulturell okänslighet eller brott.
-
skapa beskrivningar för bilder som innehåller kartor, flaggor eller jordglober. En feltolkning av dessa bilder skulle kunna leda till felaktig information och inblandning i internationella frågor.
Om du vill få en bildbeskrivning när Skärmläsaren är aktiverad trycker du på Skärmläsartangenten + Ctrl + D medan du fokuserar på visuellt innehåll. Om du vill inaktivera bildbeskrivningar i Skärmläsaren går du till Inställningar > Hjälpmedel > Skärmläsaren > Hämta bildbeskrivningar, sidrubriker och populära länkar och väljer växlingsknappen.
Det kan finnas felaktigheter i beskrivningarna som Skärmläsaren tillhandahåller. För att förbättra kvaliteten på beskrivningarna kan du ge feedback genom att:
-
Välja tummen upp eller tummen ned i en bildbeskrivning i Användargränssnittet för Skärmläsaren.
-
Svara på enstaka uppmaningar från Windows där du uppmanas att ge ett omdöme eller ge skriftlig feedback om produkten eller tjänsterna du använder.
-
Öppna Feedbackhubben för att hitta liknande feedback för att hålla med eller ge ny feedback genom att fylla i formuläret.
Microsofts engagemang för ansvarsfull AI och sekretess
Microsoft har arbetat för att främja AI på ett ansvarsfullt sätt sedan 2017, när vi först definierade våra AI-principer och senare operationaliserade vår metod genom vår Ansvarsfull AI-standard. Sekretess och säkerhet är grundläggande principer när vi utvecklar och distribuerar AI-system. Vi arbetar för att hjälpa våra kunder att använda våra AI-produkter på ett ansvarsfullt sätt, dela våra utbildningar och skapa förtroendebaserade partnerskap. Mer information om vår resa för RAI, de etiska principer som vägleder oss och de verktyg och funktioner vi har skapat för att försäkra oss om att vi utvecklar AI-teknik på ett ansvarsfullt sätt finns i RAI.
Beskrivning av avancerade bilder i Skärmläsaren är utformad för att förbättra tillgängligheten för blinda användare och användare med nedsatt syn och är inte avsedd för en större målgrupp. AI-modellerna för den här funktionen använder sammanhangsberoende ledtrådar i hela bilden, inklusive personer eller enheter i bakgrunden, vilket är hur modellerna fortfarande kan associera bilden med en individ eller beskriva känslor. Avancerade bildbeskrivningar i Skärmläsaren möjliggör känslomässiga slutsatser, men använd inte biometriska data. All bearbetning som returnerar resultat som identifierar en individ eller härleder en individs känslor är inte resultatet av bearbetning av ansiktet, såsom ansiktsigenkänning, generering och jämförelse av ansiktsmallar. Om en bild till exempel innehåller ett foto av en populär idrottsman som bär lagets tröja och deras specifika nummer, kan modellerna fortfarande returnera ett resultat som kan identifiera personen baserat på dessa sammanhangsberoende tips.
Den här funktionen bör inte användas för att härleda fysiska personers känslor på arbetsplatsen eller på utbildningsinstitutioner (t.ex. anställda eller studenter). Bildbeskrivning i Skärmläsaren kan ge detaljerade textbeskrivningar relaterade till upplevda känslor hos personer i bilder. De processer som ligger till grund för människans känslor är komplexa, och det finns kulturella, geografiska och individuella skillnader som påverkar hur vi kan uppfatta, uppleva och uttrycka känslor. Svar relaterade till känslorna hos människor i bilder baseras på hur de visas och kanske inte nödvändigtvis indikerar individuella människors interna tillstånd.
Publicerad: 11 februari 2025
Senast uppdaterad: 11 februari 2025