הערה: תיאורי תמונות עשירים ב'קורא טקסטים' זמינים בתצוגה מקדימה באמצעות התוכנית למשתתפי Windows Insider.

תיאורי תמונות ב'קורא טקסטים' מספקים תיאורים מפורטים של תוכן חזותי כגון תמונות, תרשימים, גרפים, דיאגרמות, לחצנים ללא כותרות ועוד. תיאורי תמונות עשירים מאפשרים למשתמשים עיוורים להבין תוכן חזותי באמצעות הקשר מפורט. תכונה זו זמינה כעת במחשבי Copilot+ מופעלי Snapdragon בתוכנית למשתתפי Windows Insider. מכשירי Windows אחרים ימשיכו להשתמש בחוויה הרגילה של תיאור התמונה, אשר מסתמכת אך ורק על שירותים מקוונים. 

'קורא טקסטים' משתמש במודלים של בינה מלאכותית כדי לספק תיאורים טקסטואליים מפורטים של תמונות, תרשימים וגרפים. כאשר קורא הטקסטים מופעל, באפשרותך להקיש על מקש 'קורא טקסטים' +Ctrl+D כדי לקבל תיאור של התמונה או הפריט שבהם אתה מתמקד. 

לדוגמה, התיאור של תמונה של חדר ילדים יהיה:

התמונה מתארת סידור מאורגן גדול של צמחים ירוקים קטנים, אשר הם כפי להניח נבוטים או שתילים מסודרים בתבנית רשת דחוסה מסודרת. כל צמח נמצא בתוך מיכל שחור רדוד וקטן המצביע על חדר ילדים או נטיעת צמח. הצמחים הם מרווחים בצורה שווה יצירת מראה אחיד ומיון אשר עשוי לסמל ארגון צמיחה או אוסף. הגורמים המכילים השחורים מספקים ניגודיות גבוהה לצמחים הירוקים המדגישים את המוקד בצמחים.

תיאורי תמונות ב'קורא טקסטים' מיועדים לספק תיאורי טקסט של תוכן חזותי עבור אנשים עיוורים או לקויי ראייה. התיאורים נועדו לשפר את ההבנה של תמונות, תרשימים וגרפים, ולתמיכת נגישות. באפשרותך ליצור מחדש את תיאור התמונה ולהעתיק את התיאור לעיון עתידי.

כדי להבטיח את איכות התיאורים שנוצרו על-ידי 'קורא טקסטים', נוצרה ערכת נתונים הכוללת סוגים שונים של תמונות. תמונות אלה כללו תמונות טבעיות, תרשימים, גרפים, צילומי מסך וממשקי משתמש של אפליקציה. התיאורים שנוצרו הוערכים עבור דיוק, השלמה, רלוונטיות ושימושיות. מספר שיטות הערכה, כולל שיקולי דעת של מומחים אנושיים וביאור בסיוע LLM, שימשו לאיתור תחומים לשיפור האיכות של תיאורים שנוצרו.

Microsoft מחויבת ליצור בינה מלאכותית אחראית בתכנון. עבודתנו מונחית על-ידי מערך מרכזי של עקרונות: הוגנות, מהימנות ובטיחות, פרטיות ואבטחה, כוללנות, שקיפות ואחריות.   'קורא טקסטים' עשוי לספק תיאור תמונה לא מדויק, נתונים בתרשימים או גרפים, או הסקאות רגשיות. הדבר עלול להוביל להנחות שגויות לגבי תמונה, או לכוונת התוכן החזותי בהתבסס על התיאור שנוצר. אנו ממשיכים לעבוד על המודלים שקורא הטקסטים משתמש בהם כדי לשפר את האיכות של תיאורי התמונות שסופקו. באפשרותך לשלוח משוב באמצעות כל אחת מהשיטות המתוארות במאמר כיצד ניתן לבצע לספק משוב על תיאורי תמונות ב'קורא טקסטים'? 

אין להשתמש בתכונה זו כדי: 

  • ליצור תיאורים עבור תמונות רפואיות או הקשורות לבריאות שעשויות להיות מותתות כעצה רפואית. תיאורים שגויים עלולים להוביל לפרטי מידע שגויים ולהחלטות שעלולות להזיק על-ידי משתמשים.

  • צור תיאורים עבור תמונות במסמכים משפטיים או פיננסיים כאשר הדיוק הוא קריטי. פיסוק שגוי של תמונות כאלה עלול להוביל למחלוקות משפטיות או להפסדים פיננסיים

  • ליצור תיאורים עבור תמונות המכילות סמלים תרבותיים או דתיים ללא הקשר הולם. פיסוק שגוי עלול להוביל לאי-רגישות תרבותית או לעבירה.

  • צור תיאורים עבור תמונות המכילות מפות, דגלים או גלובוסים. פיסוק שגוי של תמונות אלה עלול להוביל לתוכם מידע שגוי ומעורבות בעניינים בינלאומיים.

כדי לקבל תיאור תמונה כאשר קורא הטקסטים מופעל, הקש על מקש 'קורא טקסטים' +Ctrl+D תוך כדי התמקדות בתוכן חזותי. כדי לבטל תיאורי תמונות ב'קורא טקסטים', עבור אל הגדרות > נגישות> קוראהטקסטים > קבל תיאורי תמונות , כותרות עמודים וקישורים פופולריים ובחר את הבורר הדו-מצבי.   

ייתכן שיש אי-דיוקים בתיאורים ש'קורא טקסטים' מספק. כדי לשפר את איכות התיאורים, באפשרותך לספק משוב על-ידי: 

  • בחירת סמל האגודל כלפי מעלה או האגודל כלפי מטה בתיאור תמונה בממשק המשתמש של 'קורא טקסטים'.

  • מענה להנחיות מדי פעם מ- Windows שמבקש ממך לדרג או לספק משוב בכתב על המוצר או השירותים שבהם אתה משתמש.

  • פתיחת מרכז המשוב כדי למצוא משוב דומה כדי להצביע בעד או לתת משוב חדש על-ידי מילוי הטופס.

המחויבות של Microsoft לפרטיות וליישום העקרונות של AI אחראי

Microsoft פועלת לקידום של שימוש אחראי בבינה מלאכותית מאז 2017, כאשר הגדרנו לראשונה את העקרונות שלנו בנושא AI ומאוחר יותר גיבשנו גישה אופרציונלית דרך התקן שלנו ל- AI אחראי. פרטיות ואבטחה הם עקרונות הליבה שמנחים אותנו בפיתוח ופריסה של מערכות AI. אנחנו פועלים כדי לעזור ללקוחות שלנו להשתמש במוצרי הבינה המלאכותית שלנו באופן אחראי, לשתף את הממצאים שלנו ולבנות שותפויות המבוססות על אמון. למידע נוסף על הפעילות שלנו בתחום של AI אחראי, על העקרונות המנחים אותנו ועל הכלים והיכולות שיצרנו כדי להבטיח שטכנולוגיית הבינה המלאכותית שלנו תפותח באופן אחראי, ראה AI אחראי

תיאור תמונה עשיר ב'קורא טקסטים' נועד לשפר את הנגישות עבור משתמשים עיוורים ומשתמשים לקויי ראייה, והוא אינו מיועד לקהל רחב יותר. המודלים של בינה מלאכותית עבור תכונה זו משתמשים ברמזים הקשריים בתמונה כולה, כולל אנשים או ישויות ברקע, כך המודלים עדיין יכולים לשייך את התמונה לבודד או לתאר רגשות. תיאורי תמונות עשירים ב'קורא טקסטים' מאפשרים הסקאות רגשיות, אך אינם משתמשים בנתונים ביומטריים. כל עיבוד שמחזיר תוצאות שמזהות אדם או מסיק את רגשותיו של אדם כלשהו אינו התוצאה של עיבוד הפנים, כגון זיהוי פנים, דור והשוואה של תבניות פנים. לדוגמה, אם תמונה מכילה תמונה של ספורטאי פופולרי לובש את החולצה של הצוות שלו ואת המספר הספציפי שלו, המודלים עדיין עשויים להחזיר תוצאה שעשויה לזהות את האדם בהתבסס על רמזים הקשריים אלה. 

אין להשתמש בתכונה זו כדי להסיק או להסיק את רגשותיהם של אנשים טבעיים במקום העבודה או במוסדות חינוך (לדוגמה, עובדים או תלמידים). תיאור תמונה ב'קורא טקסטים' יכול לספק תיאורי טקסט מפורטים הקשורים לרגשות של אנשים בתמונות שנתפסו. התהליכים המשמשים רגש אנושי הם מורכבים, וישנם הבדלים תרבותיים, גיאוגרפיים ובודדים המשפיעים על האופן שבו אנו עשויים לראות, להתנסות ולהביע רגשות. תגובות הקשורות לרגשות של אנשים בתמונות מבוססות על האופן שבו הן מופיעות וייתכן שלא בהכרח יציינו את המצב הפנימי של אנשים בודדים. 

פורסם בתאריך: 11 בפברואר 2025

עדכון אחרון: 11 בפברואר 2025

זקוק לעזרה נוספת?

מעוניין באפשרויות נוספות?

גלה את יתרונות המנוי, עיין בקורסי הדרכה, למד כיצד לאבטח את המכשיר שלך ועוד.