Poznámka: Bohaté popisy obrázků v Programu Předčítání jsou dostupné ve verzi Preview prostřednictvím programu Windows Insider.
Popisy obrázků v Programu Předčítání poskytují podrobné popisy vizuálního obsahu, jako jsou obrázky, grafy, grafy, diagramy, neoznačené tlačítka a další. Bohaté popisy obrázků umožňují nevidomým uživatelům porozumět vizuálnímu obsahu prostřednictvím podrobného kontextu. Tato funkce je aktuálně dostupná na počítačích Copilot+ s procesorem Snapdragon v rámci programu Windows Insider. Ostatní zařízení s Windows budou dál používat standardní prostředí pro popis obrázků, které závisí výhradně na online služby.
Předčítání používá modely AI k poskytování podrobných textových popisů obrázků, grafů a grafů. Když je Předčítání zapnuté, můžete stisknutím klávesy Předčítání + Ctrl + D získat popis obrázku nebo položky, na kterou jste zaměřeni.
Například popis obrázku dětského pokoje by byl:
Obrázek znázorňuje velké uspořádání malých zelených listnatých rostlin, které jsou pravděpodobně klíčky nebo semenáčky uspořádané v úhledné husté mřížce. Každá rostlina je obsažena v malé mělké černé nádobě, která naznačuje školku nebo sadbu. Rostliny jsou rovnoměrně rozmístěné a vytvářejí jednotný a uspořádaný vzhled, který může symbolizovat růst organizace nebo kolekci. Černé kontejnery poskytují důrazný kontrast k zeleným klíčkům, které zvýrazňují zaměření na rostliny.
Popisy obrázků v Programu Předčítání jsou navržené tak, aby poskytovaly textové popisy vizuálního obsahu pro nevidomé nebo slabozraké osoby. Popisy slouží k lepšímu porozumění obrázkům, grafům a grafům a podpoře přístupnosti. Popis obrázku můžete znovu vygenerovat a můžete ho zkopírovat pro budoucí použití.
Aby se zajistila kvalita popisů vygenerovaných předčítáním, byla vytvořena datová sada obsahující různé typy obrázků. Tyto obrázky zahrnovaly přirozené fotografie, grafy, grafy, snímky obrazovky a uživatelská rozhraní aplikací. Vygenerované popisy byly vyhodnoceny z hlediska přesnosti, úplnosti, relevance a užitečnosti. K nalezení oblastí pro zlepšení kvality vygenerovaných popisů bylo použito několik metod hodnocení, včetně posouzení lidských expertů a bodování s asistencí LLM.
Microsoft se zavazuje vytvářet zodpovědnou AI záměrně. Naše práce se řídí základní sadou principů: nestrannost, spolehlivost a bezpečnost, ochrana osobních údajů a zabezpečení, inkluzivnost, transparentnost a odpovědnost. tématu Návody poskytnout zpětnou vazbu k popisům obrázků v Programu Předčítání?
Předčítání může poskytovat nepřesný popis obrázku, data v grafech nebo grafech nebo emocionální odvozy. To může vést k nesprávným předpokladům o obrázku nebo záměru vizuálního obsahu na základě vygenerovaného popisu. Pokračujeme v práci na modelech, které Předčítání používá ke zlepšení kvality poskytovaných popisů obrázků. Zpětnou vazbu můžete odeslat pomocí některé z metod popsaných vTato funkce by se neměla používat k:
-
generovat popisy pro lékařské obrázky nebo obrázky související se zdravím, které by mohly být chybně interpretovány jako lékařské rady. Nesprávné popisy by mohly vést k dezinformacím a potenciálně škodlivým rozhodnutím uživatelů.
-
generovat popisy obrázků v právních nebo finančních dokumentech, kde je přesnost velmi důležitá. Nesprávný výklad těchto obrázků by mohl vést k právním sporům nebo finančním ztrátám
-
generovat popisy obrázků obsahujících kulturní nebo náboženské symboly bez správného kontextu. Nesprávný výklad by mohl vést ke kulturní necitlivosti nebo urážce.
-
generovat popisy obrázků obsahujících mapy, vlajky nebo glóbusy. Nesprávný výklad těchto obrázků by mohl vést k dezinformacím a zapojení do mezinárodních záležitostí.
Pokud chcete získat popis obrázku, když je Předčítání zapnuté, stiskněte klávesu Předčítání + Ctrl + D a zaměřte se na vizuální obsah. Pokud chcete vypnout popisy obrázků v Předčítání, přejděte na Nastavení > Přístupnost > Předčítání > Získat popisy obrázků, názvy stránek a oblíbené odkazy a vyberte přepínač.
V popisech, které Předčítání poskytuje, můžou být nepřesnosti. Pokud chcete zlepšit kvalitu popisů, můžete nám poskytnout zpětnou vazbu:
-
Výběr ikony palce nahoru nebo palce dolů u popisu obrázku v uživatelském rozhraní Předčítání
-
Odpovídání na občasné výzvy ze systému Windows s požadavkem, abyste ohodnotili nebo poskytli písemnou zpětnou vazbu k používanému produktu nebo službám.
-
Otevřením Centra Feedback můžete najít podobnou zpětnou vazbu, abyste mohli hlasovat nebo poslat novou zpětnou vazbu vyplněním formuláře.
Závazek Microsoftu k zodpovědné umělé inteligenci a ochraně osobních údajů
Microsoft pracuje na zodpovědném vývoji AI od roku 2017, kdy jsme poprvé definovali naše principy AI a později náš přístup zprovoznili prostřednictvím našeho standardu odpovědné AI. Ochrana osobních údajů a zabezpečení jsou základními principy při vývoji a nasazení systémů umělé inteligence. Pracujeme na tom, abychom našim zákazníkům pomohli používat naše produkty AI zodpovědně, sdílet naše poznatky a vytvářet partnerství založená na důvěře. Další informace o našem úsilí vytvořit RAI, o etických principech, kterými se řídíme, a nástrojích a možnostech, které jsme vytvořili, abychom zajistili, že budeme vyvíjet technologie AI zodpovědně, si můžete přečíst v části RAI.
Bohatý popis obrázků v Programu Předčítání je navržený tak, aby zlepšil přístupnost pro nevidomé a slabozraké uživatele, a není určen širšímu publiku. Modely AI pro tuto funkci používají kontextové nápovědy v celém obrázku, včetně lidí nebo entit na pozadí, což je způsob, jak modely můžou stále přidružit obrázek k jednotlivci nebo popsat emoce. Bohaté popisy obrázků v Programu Předčítání umožňují emocionální odvozování, ale nepoužívají biometrická data. Jakékoli zpracování, které vrací výsledky, které identifikují jednotlivce nebo odvozuje emoce jednotlivce, není výsledkem zpracování tváře, jako je rozpoznávání obličeje, generování a porovnání šablon tváří. Pokud například obrázek obsahuje fotografii oblíbeného sportovce na dresu týmu a jeho konkrétní číslo, můžou modely přesto vrátit výsledek, který může identifikovat jednotlivce na základě těchto kontextových podnětů.
Tato funkce by se neměla používat k odvození nebo odvozování emocí fyzických osob na pracovišti nebo ve vzdělávacích institucích (např. zaměstnanců nebo studentů). Popis obrázku v Programu Předčítání může poskytovat podrobné textové popisy související s vnímaným emocím lidí na obrázcích. Procesy, které jsou základem lidských emocí, jsou složité a existují kulturní, geografické a individuální rozdíly, které ovlivňují, jak můžeme vnímat, prožívat a vyjadřovat emoce. Odpovědi související s emocemi lidí na obrázcích jsou založené na tom, jak vypadají, a nemusí nutně přesně ukazovat na vnitřní stav jednotlivých lidí.
Publikováno: 11. února 2025
Poslední aktualizace: 11. února 2025