كيفية تصنيف MSN للمحتوى

تنشر MSN القصص الإخبارية ومعارض الصور ومقاطع الفيديو من الآلاف من الناشرين على مستوى العالم وتروج لهذا المحتوى عبر منتجات Microsoft، بما في ذلك Microsoft Edge وMicrosoft Windows MSN.com تطبيق MSN للأجهزة المحمولة.

في كل مرة يعرض فيها المستهلك موجز MSN، يتم تحديثه بأحدث محتوى مخصص. استنادا إلى إشارات مختلفة، تحدد الخوارزميات المحتوى وتأمر به في الموجز مع الإشراف التحريري. تم تصميم نظام محتوى التصنيف هذا للمشاركة والمعلومات، واختيار القصص الأكثر صلة بكل شخص، مع ضمان أن يكون المحتوى في الوقت المناسب، وجديرا بالأخبار، وعالي الجودة، وآمنا للعمل والمنزل.

قد تختلف الأهمية النسبية لهذه المعلمات في كل مرة يعرض فيها المستخدم موجز الأخبار. تتطور الخوارزميات دائما بينما نحدد باستمرار الإشارات ونحسنها ونجرب الميزات الجديدة.

في هذه المقالة

صلة المستخدم

التنسيق

معدل النقر (CTR)

نضارة وحسن التوقيت

الاتجاهات والجهة الإخبارية

سلطة العلامة التجارية

الإشارات السالبة والنقر

صلة المستخدم

تقدم Microsoft لكل مستهلك موجز أخبار مخصصا لتلبية مجموعة الاهتمامات والتفضيلات الفريدة لكل شخص للمحتوى. في جوهر هذا التخصيص توجد خوارزميات تطابق تفضيلات المستخدم مع فهم المستند. تم تصميم هذه الخوارزميات لتحديد المحتوى الأكثر صلة لكل مستخدم.

يتعلم النظام تفضيلات المستخدم بمرور الوقت من خلال نهجين:

  • إضفاء طابع شخصي صريح. تحترم الخوارزمية كيفية تكوين المستخدمين لإعداداتهم يدويا، بما في ذلك إجراءات مثل متابعة مواضيع معينة، أو الإعجاب بمحتوى معين أو عدم الإعجاب به، أو الإشارة إلى تفضيل الناشر.
  • التخصيص الضمني. وفقا لإعدادات خصوصية المستخدم، نظرا لأن الشخص يقرأ المحتوى ويتفاعل مع منتجات Microsoft، يتم تحليل القصص للحصول على أنماط لفهم تفضيلات المستخدم بشكل أفضل. تبحث الخوارزميات عن أنماط طويلة الأجل وقصيرة الأجل لكل مستخدم، مع الاعتراف بأن اهتمامات المحتوى قد تختلف على المدى القصير، مع إظهار اتجاهات مختلفة على المدى الطويل. (اقرأ المزيد حول خصوصية Microsoft هنا).

تعمل خوارزميات التعلم الآلي على فهم مستند عميق يتجاوز مجرد التعرف على "الموضوعات": يقوم النظام بإجراء تحليل على كل مستند للحصول على رؤى تستند إلى النص وبيانات التعريف ويحول المحتوى إلى نموذج رياضي.

يمكن مقارنة النموذجين الرياضيين – تفضيلات المستخدم وفهم المستندات – بتحديد المحتوى الأقرب لكل شخص.

بالإضافة إلى مطابقة المحتوى مباشرة مع كل مستخدم، تبحث الخوارزميات أيضا عن المحتوى الذي يشرك المستخدمين الذين لديهم تفضيلات مماثلة.

التنسيق

نريد تعزيز محتوى الجودة في موجزنا الذي لا يحتوي على عيوب بصرية مثل عناصر الرأس المفقودة أو القوائم المفقودة أو عناوين URL المفقودة أو الكلمات/العبارات غير ذات الصلة التي تؤدي إلى تجربة مستخدم ضعيفة. لتجنب رؤية المحتوى الخاص بك تعرضا محدودا، تأكد من اتباع إرشادات النشر بما في ذلك ما يلي:

كتل طويلة من النص غير المنسق

المحتوى عالي الجودة وبدون عيوب مثل النص غير المنسق لديه احتمال أعلى للحصول على رؤية في الموجز. تأكد من أنه يحتوي على بنية الجملة والفقرة المناسبة والترميز عند تحميلها. لن تتم ترقية المقالات التي لا تحتوي على أي فواصل أسطر أو فواصل فقرات في الموجز.

مثال على النص المنسق: <p>هذه فقرة.</p> (لاحظ رمز الفتح والإغلاق).

ارتباطات المقالة الأصلية

يمكن أن تظهر الارتباطات التي تعود إلى المقالة الأصلية في أسفل المقالة فقط. سيكون للوظائف التي ترتبط مرة أخرى بالنسخة الأصلية داخل النص الأساسي وصولا محدودا.

عنوان URL لنص عادي

إذا كان لديك ارتباطات في المحتوى الخاص بك، فستحتاج إلى التأكد من تنسيقها بشكل مناسب. على سبيل المثال، إذا كانت الارتباطات في المحتوى تبدو كما يلي: https://www.conotoso.com/r/linden-new-york إذا لم يتم تنسيق المحتوى بشكل صحيح وقد يكون التعرض محدودا أو إزالته وفقا لذلك.

تنسيق تاريخ صالح

لضمان أن محتوىنا ذو صلة بالمستهلكين، يجب علينا التأكد من أن المقالات التي نعرضها لها محدثة بدقة. يجب التعبير عن التواريخ باستخدام تنسيقات تاريخ RFC 3339 أو RFC 822.

أمثلة تنسيق التاريخ الصالحة:

  • الأربعاء، 04 أكتوبر 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

معدل النقر (CTR)

معدل النقر (CTR) — عدد النقرات مقسوما على عدد مرات الظهور — هو أحد قياسات التفاعل المستخدمة في تحديد ترتيب المحتوى. يتأثر CTR بشكل أساسي بعناصر المحتوى التي تظهر عند الترويج للارتباط، بما في ذلك العنوان/العنوان والصورة والتجريد. التعلم الآلي يحكم على إمكانية CTR لكل جزء من المحتوى.

المحتوى ذو CTR العالي جيد بشكل عام، على الرغم من أن هناك أيضا فئة من المحتوى التي قد تحتوي على CTR عالية ولكنها تولد أيضا عدم رضا من القراء - clickbait. راجع المزيد حول هذا أدناه في قسمنا حول الإشارات السلبية.

نضارة وحسن التوقيت

من المتوقع أن يكون المحتوى في موجز الأخبار "جديدا" وفي الوقت المناسب. ونتيجة لذلك، يصنف المحتوى الأحدث أعلى من المحتوى الأقدم، في المتوسط. الأحدث في الأخبار أو التمويل أو القصص الرياضية مهمة لأن هذه الأعمدة تميل إلى أن يكون لها قصص في هذا العمر بسرعة. تتعرف الخوارزميات على مواضيع أخرى تميل إلى أن تكون أكثر خضرة وتسمح لهذا المحتوى بأن يكون قديما، مع إدراك ذلك. قد يتم ترتيب المحتوى ذي التواريخ المنشورة غير الدقيقة مرتبة أقل.

في المتوسط، يتم تصنيف القصص حول الموضوعات الأكثر شيوعا والأخبار العاجلة والأخبار الرئيسية بشكل أكبر. غالبا ما يتم حجز المناصب العليا في الموجز لأخبار اليوم الرائدة الجديرة بالأخبار.

تتم ملاحظة الاتجاهات من خلال مراقبة مصادر بيانات خارجية متعددة، عامة وملكية على حد سواء. يراقب النظام ما هو اتجاه على الإنترنت بشكل عام، بالإضافة إلى ما هو أكثر اتجاها على لوحات Microsoft وبحث Bing. يتم دمج هذه الإشارات ومتوسطها لتصنين كل عنصر محتوى على احتمالية اتجاهه. يتم ترتيب العناصر ذات الإمكانات المحتملة أعلى في الموجز.

سلطة العلامة التجارية

القصص من ناشري الأخبار الوطنية أو العالمية المعروفة لها وزن أكبر، لأن المستهلكين والناشرين على حد سواء ينظرون إليها على أنها أكثر موثوقية وموثوقية. ومع ذلك، فإن القصص من العلامات التجارية المحلية أو الأقل شهرة هي أيضا مكونات مهمة من الموجزات المخصصة وغالبا ما يتم تصنيفها بشكل كبير بسبب إشارات أخرى.

الخوارزميات لا تعتبر بعد السلطة حسب الموضوع: على سبيل المثال، بعض الناشرين أكثر موثوقية في مجال الرياضة، في حين أن البعض الآخر متخصص في السياسة. هذا مجال تتوقع Microsoft تحسينه في تحديثات التصنيف المستقبلية.

الإشارات السالبة والنقر

يولد بعض المحتوى نقرات، ولكنه يولد أيضا عدم رضا المستخدمين الذين يرون أن العنوان مضلل (لا يقدم المحتوى الذي وعد به العنوان) أو قصة ذات جودة أقل. ومن الأمثلة على ذلك العناوين الرئيسية المضللة أو المبالغة في القصة أو الصادمة أو العاطفية بشكل مفرط. يعرف هذا المحتوى بشكل شائع باسم clickbait، وقد يتم تصنيف هذا المحتوى بشكل أقل استنادا إلى سلوك المستخدم الذي يشير إلى عدم الرضا من خلال إجراءات مثل معدل الارتداد العالي.

تتضمن الأنماط المحددة ما يلي:

  • عنوان رئيسي يتجاوز المضايقة، خاصة مع الاستخدام المفرط ل adverb "هذا" (على سبيل المثال، لا تشرب أبدا هذا على متن الطائرة).
  • عنوان يسيء تمثيل محتوى القصة الفعلي و/أو استيراده، وبالتالي يفشل في تلبية توقعات القارئ. قد يتراوح الوعد المقطوع بين حذف أحد الأصول (مثل الفيديو المشار إليه في العنوان) أو عدم معالجة المعلومات الرئيسية على الإطلاق.

المحتوى الذي قد يسبب عدم الراحة

كجزء من جهودنا المستمرة لتحسين جودة المحتوى والحفاظ على تجربة إيجابية لجميع المستخدمين، تطبق MSN معايير أكثر صرامة على المحتوى الذي قد ينظر إليه على أنه مسيء أو رسومي أو غير مناسب. قد يتم إلغاء فرز المنشورات أو إزالتها إذا كانت العناوين أو الصور أو النص الأساسي تتضمن مواد مزعجة أو مجزأة تفتقر إلى مواد تحريرية أو ذات صلة مجتمعية أوسع.

تتضمن أمثلة المحتوى الذي قد يؤدي إلى هذه الإشارات ما يلي:

  • تصوير مفصل للوظائف الجسدية (على سبيل المثال، انتفاخ البطن، الإفراز، التبول، ظهور البثور)
  • الأمراض المنقولة جنسيا
  • لقاءات لود (على سبيل المثال، الاجتماعات مع المشتغلين بالجنس، والجنس العام، والتعري العام) حيث لا توجد صلة مجتمعية أوسع مثل فضيحة سياسية.
  • قصص الجريمة التي تتضمن تفاصيل مفرطة (على سبيل المثال، تفاصيل الفعل الجنسي أو القتل البشع) التي تتجاوز الحقائق المجراة
  • قصص التهييص أو القصص التي يعنونها الكبار (على سبيل المثال، المشورة الجنسية الصريحة) غير مناسبة للجمهور العام
  • محتوى يشير إلى الانحراف الجنسي والأفضلية
  • السلوك الجنسي للحيوانات
  • تحلل الرسومات (على سبيل المثال، اللحوم الموبوبة بالمغازل)

قد يقلل هذا النوع من المحتوى من ثقة القارئ وغالبا ما يتم وضع علامة عليه على أنه غير مناسب للتوزيع الواسع.

اعتمادا على الخطورة، قد يكون للمحتوى التالي تعرض محدود أو إزالته وفقا لذلك، مما يؤدي إلى انخفاض الانطباع على مستوى المقالة:

  • المشاهير الثرثرة : نحن الآن الحد من التعرض للمحتوى المشاهير التي تركز على (على سبيل المثال لا الحصر) معارك المشاهير ، وجنس ما يرتديه المشاهير ، وخلل خزانة الملابس ، يوما بعد يوم أنشطة المشاهير ، وقضايا العلاقة ، الخ. ومع ذلك، سيظل هذا المحتوى يظهر على صفحات MSN، ولكن لن يتم عرضه إلا للمستخدمين الذين يبحثون عن هذا النوع من المحتوى.