כיצד MSN מדרגת תוכן
MSN מפרסם סיפורי חדשות, גלריות תמונות וסרטוני וידאו של אלפי מפרסמים ברחבי העולם ומקדם תוכן זה במוצרי Microsoft, כולל Microsoft Edge, Microsoft Windows, MSN.com, ואת האפליקציה למכשירים ניידים MSN.
בכל פעם שהצרכן מציג את הזנת MSN, הוא מתרענן עם התוכן המותאם אישית העדכני ביותר. בהתבסס על אותות שונים, אלגוריתמים בוחרים ומבצעים הזמנה לתוכן בהזנה באמצעות פיקוח על מערכת. מערכת תוכן דירוג זו מיועדת ליצור מעורבות ולידע אותה, תוך בחירת סיפורים הרלוונטיים ביותר לכל אדם, ובכך גם להבטיח שהתוכן יהיה בזמן, אמין, איכותי ובטוח לעבודה ולבית.
החשיבות היחסית של פרמטרים אלה עשויה להשתנות בכל פעם שמשתמשים עשויים להציג הזנת חדשות. האלגוריתמים מתפתחים תמיד כאשר אנו מזהים ומשפרים אותות ללא הרף ומתנסים בתכונות חדשות.
במאמר זה
רלוונטיות משתמש
Microsoft מספקת לכל צרכן הזנת חדשות מותאמת אישית כדי לעמוד בערכת תחומי העניין וההעדפות הייחודיים של כל אדם עבור תוכן. ליבת התאמה אישית זו הם אלגוריתמים התואמים את העדפות המשתמש להבנת מסמכים. אלגוריתמים אלה מיועדים לבחור את התוכן הרלוונטי ביותר עבור כל משתמש.
העדפות המשתמש נלמדות לאורך זמן על-ידי המערכת באמצעות שתי גישות:
- התאמה אישית מפורשת. האלגוריתם מכבד את האופן בו משתמשים קובעים באופן ידני את ההגדרות שלהם, כולל פעולות כגון ביצוע נושאים מסוימים, סימון 'אהבתי' או 'אהבתי תוכן ספציפי' או ציון העדפת מפרסם.
- התאמה אישית משתמעת. בהתאם להגדרות הפרטיות של המשתמש, בזמן שאדם קורא תוכן ומעורב במוצרים של Microsoft, הסיפורים מנתחים אחר דפוסים כדי להבין טוב יותר את העדפות המשתמש. האלגוריתמים עשויים לחפש דפוסים לטווח ארוך וקצר טווח עבור כל משתמש, הכרה בכך שתחומי העניין של תוכן עשויים להשתנות בטווח הקצר, תוך הצגת מגמות ארוכות טווח שונות. (קרא עוד על פרטיות Microsoft כאן).
אלגוריתמים של למידת מכונה מובילים הבנת מסמך עמוק מעבר לזיהוי 'נושאים': המערכת מבצעת ניתוח בכל מסמך כדי לקבל תובנות בהתבסס על טקסט ומטה-נתונים, וממירה את התוכן למודל מתמטי.
ניתן להשוות בין שני המודלים המתמטיים – העדפות המשתמש והבנת המסמך – כדי לבחור תוכן שהנו ההתאמה הקרובה ביותר עבור כל אדם.
בנוסף להתאמה ישירה של תוכן לכל משתמש, האלגוריתמים גם מבצעים חיפוש אחר תוכן שמעורב במשתמשים עם העדפות דומות.
עיצוב
אנחנו רוצים לקדם את תוכן האיכות בהזנה שלנו שאין בו פגמים חזותיים כגון רכיבי כותרת חסרים, רשימה חסרה, כתובות URL חסרות או מילים/צירופי מילים לא רלוונטיים שהתוצאה היא חוויית משתמש ירודה. כדי למנוע את החשיפה המוגבלת של התוכן, ודא שאתה עוקב אחר הנחיות הפרסום, כולל:
בלוקים ארוכים של טקסט לא מעוצב
תוכן באיכות גבוהה וללא פגמים כגון טקסט לא מעוצב הוא בעל הסתברות גבוהה יותר לקבלת ניראות בהזנה. ודא שהוא כולל את מבנה המשפט והפיסקה וקידוד המשפטים והפיסקה המתאימים בעת העלאתם. מאמרים ללא מעברי שורה או מעברי פיסקה לא יתקדמו בהזנה.
דוגמה של טקסט מעוצב: <p>זוהי פיסקה.</p> (שים לב לקוד הפתיחה והסיום).
קישורים למאמרים מקוריים
קישורים בחזרה למאמר המקורי יכולים להופיע רק בחלק התחתון של המאמר. הצבות המקשרות חזרה למקור בגוף הטקסט הראשי יהיו עם גישה מוגבלת.
כתובת URL של טקסט רגיל
אם יש לך קישורים בתוכן שלך, עליך לוודא שהם מעוצבים כראוי. לדוגמה, אם הקישורים בתוכן שלך נראים כך: https://www.conotoso.com/r/linden-new-york התוכן שלך אינו מעוצב כראוי וייתכן שהחשיפה שלו מוגבלת או שהתוכן יוסר בהתאם.
תבנית תאריך חוקית
כדי להבטיח שהתוכן שלנו רלוונטי לצרכנים שלנו, עלינו לוודא שהמאמרים שאנו מציגים להם מתוארים באופן מדויק. יש לבטא תאריכים באמצעות תבניות תאריך RFC 3339 או RFC 822.
דוגמאות חוקיות לתבנית תאריך:
- ד', 04 אוק' 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
קצב לחיצה (CTR)
שיעור הלחיצה (CTR) - מספר הלחיצה המחולקת במספר התרשמות – הוא מידה אחת של מעורבות המשמשת לקביעת דירוג תוכן. ה- CTR מושפע בעיקר מרכיבים של תוכן שמוצגים בעת קידום הקישור, כולל הכותרת/הכותרת, התמונה והתקציר. למידת מכונה שופטת את הפוטנציאל של ה-CTR לכל פריט תוכן.
תוכן עם CTR גבוה הוא בדרך כלל טוב, למרות שיש גם קטגוריה של תוכן שעשוי להיות CTR גבוה, אך גם מייצר חוסר שביעות רצון מהקוראים - clickbait. למידע נוסף, עיין בסעיף שלנו בנושא אותות שליליים.
רענון וצירי זמן
תוכן בהזנת חדשות צפוי להיות "רענן" וזמן. כתוצאה מכך, תוכן חדש יותר מדרג גבוה יותר מתוכן ישן יותר, בממוצע. החדשות האחרונות, כספים או סיפורי ספורט הן חשובות, מכיוון שהטקסט האנכי הזה נוטה לכלול סיפורים בגיל זה במהירות. האלגוריתמים מזהים נושאים אחרים נוטים להיות ירוקי-עד יותר ולאפשר לתוכן זה להיות ישן יותר, ומזהים זאת. תוכן עם תאריכים לא מדויקים שפורסמו עשוי להיות מדורג נמוך יותר.
מגמות ומהיכנות חדשותית
בממוצע, סיפורים על נושאים טרנדיים, מבזקי חדשות וכותרות מדורגים בצורה גבוהה יותר. המיקומים המובילים בהזנה שמורים לעתים קרובות לחדשות החדשותיות המובילות של היום.
מגמות נצפות על-ידי ניטור מקורות נתונים חיצוניים מרובים, הן ציבוריות והן קנייניות. המערכת מנטרת את מה שטרנדי באינטרנט בכללותו, וכן את מה שטרנדי בד ציור של Microsoft וחיפוש Bing. אותות אלה משולבים וממוצעים כדי לדרג כל פריט תוכן על הפוטנציאל שלו להיות טרקטיבי. פריטים עם פוטנציאל גדול יותר מדורגים במקום גבוה יותר בהזנה.
רשות מותג
סיפורים של מפרסמי חדשות לאומיים או גלובליים ידועים הם בעלי משקל כבד יותר, מכיוון שצרכנים ומפרסמים כאחד מציגים אותם כמושרתיים ומהימנים יותר. עם זאת, סיפורים ממותגים מקומיים או פחות ידועים הם גם רכיבים חשובים של הזנות מותאמות אישית, ולתדירות גבוהה מדורגים גבוה בשל אותות אחרים.
האלגוריתמים עדיין לא מחשיבים סמכות לפי נושא: לדוגמה, מפרסמים מסוימים מוסמכים יותר בתחום הספורט, ואילו אחרים מתמחים בפוליטיקה. זהו אזור ש- Microsoft מצפה להשתפר בו עדכוני דירוג עתידיים.
אותות שליליים ו- clickbait
חלק מהתוכן יוצר לחיצות, אך גם גורם ל חוסר שביעות רצון ממשתמשים שתופסים כותרת ככותרת מונות (לא מספקים את התוכן שהכותרת שהובטחה) או את הסיפור של איכות נמוכה יותר. דוגמאות לכך כוללות כותרות המונות, מגזישות את הסיפור, או מפתיעות מדי או רגשיות. תוכן זה, הידוע כ- clickbait, עשוי להיות מדורג נמוך יותר בהתבסס על אופן הפעולה של המשתמשים, שמציע חוסר שביעות רצון באמצעות פעולות כגון שיעור החזרה גבוה.
תבניות ספציפיות כוללות:
- כותרת עוברת מעבר להתגרות, במיוחד בשימוש לרעה של תואר הפועל "this" (לדוגמה, Never Drink This on a Plane).
- כותרת שמצגה באופן שגוי את תוכן הכתבה ו/או הייבוא בפועל, ובכך אינה עומדת בציפיות הקוראים. הבטחה לא חוקית עשויה למנוע השמטה של נכס (כגון סרטון ההפניה לכותרת) או לא לטפל בכלל במידע העיקרי.
תוכן שעשוי לגרום לאי-נוחות
כחלק מהמאמצים המתמשכת שלנו לשפר את איכות התוכן ולשמור על חוויה חיובית עבור כל המשתמשים, MSN מחילה סטנדרטים מחמירים יותר על תוכן שעשוי להיראות פוגעני, גרפי או בלתי הולם. פרסומים עשויים להיות מומענים או יוסרו אם כותרות, תמונות או גוף הטקסט כוללים חומר מטריד או titillating שחסרה לו רלוונטיות רחבה יותר של מערכת או חברה.
דוגמאות לתוכן שעשוי להפעיל אותות אלה כוללות:
- תיאורים מפורטים של פונקציות גופניות (לדוגמה, הרחבה, הרחבה, השתנה, סרסור מתפוצץ)
- מחלות מועברות מינית
- מפגשים גסה (לדוגמה, פגישות עם עובדי מין, מין ציבורי, עירום ציבורי) בהן אין רלוונטיות חברותית רחבה יותר, כגון שערורייה פוליטית.
- סיפורי פשע הכוללים פרטים מופרזים (לדוגמה, הפרטים של מעשה מיני או רצח זוועה) מעבר לעובדות החשופות
- סיפורים מעניינים או למבוגרים (לדוגמה, עצות מיניות מפורשות) שאינם מתאימים לקהלים כלליים
- תוכן המפנה ל סטייה מינית ובינה מלאכותית
- התנהגות מינית של בעלי חיים
- פירוק גרפי (לדוגמה, בשר ששוררץ במזחלות)
תוכן מסוג זה עשוי להפחית את האמון של הקורא, והוא מסומן לעתים קרובות כברירת מחדל להפצה רחבה.
בהתאם לחומרה, ייתכן שהחשיפה או ההוסרה של התוכן הבא מוגבלת בהתאם, דבר המוביל לירידה ברושם ברמת המאמר:
- רכילות סלבריטאים: אנחנו מגבילים כעת את החשיפה של תוכן סלבריטאים שמתמקד (אך לא מוגבל) בקרבות סלבריטאים, מיניות מה סלבריטאים לובשים, תקלות ארון בגדים, פעילויות ידוענים מיום ליום, בעיות במערכת יחסים וכו'. עם זאת, תוכן זה עדיין יופיע בדפי MSN ייחשף רק למשתמשים שמחפשים סוג תוכן זה.