Megjegyzés: A Narrátor részletes képleírásai előzetes verzióban érhetők el a Windows Insider Programon keresztül.
A Narrátor képleírásai részletes leírást nyújtanak a vizuális tartalmakról, például képekről, diagramokról, grafikonokról, diagramokról, címkézetlen gombokról és egyebekről. A részletes képleírások lehetővé teszik a vak felhasználók számára a vizuális tartalom részletes kontextuson keresztüli megértését. Ez a funkció jelenleg a Windows Insider Program Snapdragon-alapú Copilot+ pc-jén érhető el. Más Windows-eszközök továbbra is a szabványos rendszerkép-leírási felületet használják, amely kizárólag a online szolgáltatások támaszkodik.
A Narrátor AI-modelleket használ a képek, diagramok és grafikonok részletes szöveges leírásához. Ha a Narrátor be van kapcsolva, a Narrátor billentyű+Ctrl+D billentyűkombinációval lekérheti a fókuszban lévő kép vagy elem leírását.
Egy óvoda képének leírása például a következő:
A képen a kis zöld leveles növények nagy szervezett elrendezése látható, amelyek valószínűleg csírák vagy palánták, rendezett, sűrű rácsos mintázattal. Minden növény egy kis, sekély fekete tartályban található, amely óvoda vagy ültetési beállítást javasol. A növények egyenletesen oszlanak el, egységes és rendezett megjelenést alkotva, ami a növekedésszervezést vagy a gyűjteményt szimbolizálhatja. A fekete konténerek éles kontrasztot biztosítanak a zöld hajtásokkal, kiemelve a növények fókuszát.
A Narrátor képleírásai úgy vannak kialakítva, hogy szöveges leírásokat biztosítsanak a vizuális tartalmakról a vakok és gyengénlátók számára. A leírások célja, hogy jobban megismerje a képeket, diagramokat és grafikonokat, és támogassa a kisegítő lehetőségeket. Újragenerálhatja a kép leírását, és későbbi referenciaként másolhatja a leírást.
A Narrátor által létrehozott leírások minőségének biztosítása érdekében létre lett hozva egy adatkészlet, amely különböző típusú képeket tartalmaz. Ezek a képek természetes fényképeket, diagramokat, grafikonokat, képernyőképeket és alkalmazás-felhasználói felületeket tartalmaztak. A létrehozott leírások pontosságát, teljességét, relevanciáját és hasznosságát értékelték ki. Számos értékelési módszert, köztük az emberi szakértői ítéleteket és az LLM által támogatott pontozást használták a létrehozott leírások minőségének javítására szolgáló területek megtalálására.
A Microsoft elkötelezett a felelősségteljes mesterséges intelligencia kialakítása mellett. Munkánkat a következő alapelvek vezérlik: méltányosság, megbízhatóság és biztonság, adatvédelem és biztonság, befogadás, átláthatóság és elszámoltathatóság. Hogyan a narrátorban ismertetett módszerek bármelyikével visszajelzést küldhet a képek leírásáról?
A Narrátor pontatlan képleírást, diagramokon vagy grafikonokon szereplő adatokat, illetve érzelmi következtetéseket is tartalmazhat. Ez helytelen feltételezésekhez vezethet egy képpel kapcsolatban, vagy a vizuális tartalom szándékához a generált leírás alapján. Továbbra is dolgozunk azon a modelleken, amelyekkel a Narrátor a megadott képleírások minőségét javítja. Küldhet visszajelzést aEz a funkció nem használható a következő célokra:
-
olyan orvosi vagy egészségügyi képek leírásának létrehozása, amelyek orvosi tanácsadásként félreérthetők. A helytelen leírások félretájékoztatáshoz és potenciálisan káros döntésekhez vezethetnek a felhasználók számára.
-
olyan képek leírásának létrehozása jogi vagy pénzügyi dokumentumokban, ahol a pontosság kritikus fontosságú. Az ilyen képek félreértelmezése jogi vitákhoz vagy pénzügyi veszteségekhez vezethet
-
a kulturális vagy vallási szimbólumokat tartalmazó képek leírásának létrehozása megfelelő kontextus nélkül. A félreértelmezés kulturális érzéketlenséghez vagy bűncselekményhez vezethet.
-
térképeket, zászlókat vagy földgömböket tartalmazó képek leírásának létrehozása. A képek félreértelmezése félretájékoztatáshoz és nemzetközi ügyekbe való bevonásához vezethet.
Ha a Narrátor bekapcsolt állapotában szeretné lekérni a képek leírását, nyomja le a Narrátor billentyű+Ctrl+D billentyűkombinációt, miközben a vizuális tartalomra összpontosít. Ha ki szeretné kapcsolni a képek leírását a Narrátorban, lépjen a Beállítások > Kisegítő lehetőségek > A Narrátor > Képleírások, lapcímek és népszerű hivatkozások lekérése , majd válassza a kapcsolót.
Előfordulhatnak pontatlanságok a Narrátor által megadott leírásokban. A leírások minőségének javítása érdekében a következőkkel küldhet visszajelzést:
-
A Narrátor felhasználói felületén a képleírásban található felfelé vagy lefelé mutató hüvelykujj ikon kiválasztása.
-
Válasz a Windows esetenkénti kéréseire, és arra kérik, hogy értékelje vagy küldjön írásos visszajelzést az Ön által használt termékről vagy szolgáltatásokról.
-
Ha megnyitja a Visszajelzési központot , az űrlap kitöltésével hasonló visszajelzést kaphat, vagy új visszajelzést küldhet.
A Microsoft elkötelezett a felelős AI és adatvédelem iránt
A Microsoft 2017 óta dolgozik a mesterséges intelligencia felelősségteljes előmozdításán, hiszen ekkor határoztuk meg először az AI alapelveit, majd később a Felelős AI Standardon keresztül tettük működőképessé a megközelítésünket. Az adatvédelem és a biztonság a fő alapelvek a mesterséges intelligencia rendszerek fejlesztése és telepítése során. Arra törekszünk, hogy ügyfeleink felelősségteljesen használják AI-termékeinket, megosszák tudásunkat, és bizalmon alapuló partneri kapcsolatokat építsünk ki. A felelős mesterséges intelligenciával kapcsolatos erőfeszítéseinkről, a minket vezérlő elvekről, valamint az általunk létrehozott eszközökről és szolgáltatásokról, amelyekkel biztosítjuk, hogy a mesterséges intelligencia technológiát felelősségteljesen fejlesszük, bővebben a Felelős AI című dokumentumban olvashat.
A Narrátor részletes képleírása úgy lett kialakítva, hogy javítsa a vakok és gyengénlátók akadálymentességét, és nem a szélesebb közönség számára készült. A funkció AI-modelljei környezetfüggő jeleket használnak a teljes képen, beleértve a háttérben lévő személyeket vagy entitásokat is, így a modellek így is társíthatják a képet egy adott személyhez, vagy leírhatják az érzelmeket. A Narrátor részletes képleírásai érzelmi következtetéseket tesznek lehetővé, de nem használnak biometrikus adatokat. Minden olyan feldolgozás, amely az egyén azonosítására vagy az egyén érzelmeinek kikövetkeztetésére vonatkozó eredményeket ad vissza, nem az arc feldolgozásának eredménye, például az arcfelismerés, az arcsablonok létrehozása és összehasonlítása. Ha például egy kép egy népszerű sportoló fényképét tartalmazza, aki a csapat mezét és a saját számát viseli, a modellek továbbra is visszaadhatnak olyan eredményt, amely a környezetfüggő jelek alapján azonosíthatja az egyént.
Ez a funkció nem használható arra, hogy a természetes személyek érzelmeit a munkahelyen vagy az oktatási intézményekben (pl. alkalmazottak vagy diákok) kikövetkeztetjék vagy kikövetkeztetjék. A Narrátor képleírása részletes szöveges leírásokat adhat meg a képeken lévő személyek érzékelt érzelmeivel kapcsolatban. Az emberi érzelem alapjául szolgáló folyamatok összetettek, és kulturális, földrajzi és egyéni különbségek vannak, amelyek befolyásolják, hogy hogyan érzékelhetjük, tapasztalhatjuk és fejezhetjük ki az érzelmeket. A képeken szereplő emberek érzelmeivel kapcsolatos válaszok megjelenésük alapján jelennek meg, és nem feltétlenül jelzik pontosan az egyes személyek belső állapotát.
Közzétéve: 2025. február 11.
Legutóbb frissítve: 2025. február 11.