Πώς κατατάσσει το περιεχόμενο το MSN

Το MSN δημοσιεύει ειδήσεις, συλλογές φωτογραφιών και βίντεο από χιλιάδες εκδότες παγκοσμίως και προωθεί αυτό το περιεχόμενο σε όλα τα προϊόντα της Microsoft, συμπεριλαμβανομένου του Microsoft Edge, των Microsoft Windows, MSN.com και της εφαρμογής MSN για κινητές συσκευές.

Κάθε φορά που ένας καταναλωτής βλέπει την τροφοδοσία MSN, ανανεώνεται με το πιο πρόσφατο εξατομικευμένο περιεχόμενο. Με βάση διάφορα σήματα, οι αλγόριθμοι επιλέγουν και παραγγέλνουν περιεχόμενο στην τροφοδοσία με συντακτική εποπτεία. Αυτό το σύστημα περιεχομένου κατάταξης έχει σχεδιαστεί για να αλληλεπιδρά και να πληροφορεί, επιλέγοντας ιστορίες που είναι πιο σχετικές με κάθε άτομο, διασφαλίζοντας παράλληλα ότι το περιεχόμενο είναι έγκαιρο, αξιόπλοο, υψηλής ποιότητας και ασφαλές για την εργασία και το σπίτι.

Η σχετική σημασία αυτών των παραμέτρων ενδέχεται να διαφέρει κάθε φορά που προβάλλεται μια τροφοδοσία ειδήσεων από ένα χρήστη. Οι αλγόριθμοι εξελίσσονται συνεχώς καθώς αναγνωρίζουμε και βελτιώνουμε συνεχώς τα σήματα και πειραματιζόμαστε με νέες δυνατότητες.

Σε αυτό το άρθρο

Συνάφεια χρήστη

Μορφοποίηση

Ρυθμός μετάδοσης με ένα κλικ (CTR)

Φρεσκάδα και επικαιρότητα

Τάσεις και αξία ειδήσεων

Αρχή εμπορικής επωνυμίας

Αρνητικά σήματα και clickbait

Συνάφεια χρήστη

Η Microsoft παρέχει σε κάθε καταναλωτή μια εξατομικευμένη τροφοδοσία ειδήσεων, ώστε να ανταποκρίνεται στο μοναδικό σύνολο ενδιαφερόντων και προτιμήσεων κάθε ατόμου για το περιεχόμενο. Στον πυρήνα αυτής της εξατομίκευσης βρίσκονται αλγόριθμοι που ταιριάζουν με τις προτιμήσεις του χρήστη με την κατανόηση του εγγράφου. Αυτοί οι αλγόριθμοι έχουν σχεδιαστεί για να επιλέγουν το πιο σχετικό περιεχόμενο για κάθε χρήστη.

Οι προτιμήσεις ενός χρήστη μαθαίνονται με την πάροδο του χρόνου από το σύστημα μέσω δύο προσεγγίσεων:

  • Ρητή εξατομίκευση. Ο αλγόριθμος σέβεται τον τρόπο με τον οποίο οι χρήστες ρυθμίζουν με μη αυτόματο τρόπο τις ρυθμίσεις τους, συμπεριλαμβανομένων ενεργειών όπως η παρακολούθηση ορισμένων θεμάτων, η επισήμανση "μου αρέσει" ή η αντιπάθεια συγκεκριμένου περιεχομένου ή η δήλωση προτίμησης εκδότη.
  • Έμμεση εξατομίκευση. Σύμφωνα με τις ρυθμίσεις προστασίας προσωπικών δεδομένων ενός χρήστη, καθώς ένα άτομο διαβάζει περιεχόμενο και αλληλεπιδρά με τα προϊόντα της Microsoft, οι ιστορίες αναλύονται για μοτίβα, ώστε να κατανοηθούν καλύτερα οι προτιμήσεις του χρήστη. Οι αλγόριθμοι αναζητούν τόσο μακροπρόθεσμα όσο και βραχυπρόθεσμα μοτίβα για κάθε χρήστη, αναγνωρίζοντας ότι τα ενδιαφέροντα περιεχομένου μπορεί να διαφέρουν βραχυπρόθεσμα, ενώ παρουσιάζουν διαφορετικές μακροπρόθεσμες τάσεις. (Διαβάστε περισσότερα σχετικά με την προστασία προσωπικών δεδομένων της Microsoft εδώ).

Οι αλγόριθμοι μηχανικής εκμάθησης οδηγούν σε βαθιά κατανόηση των εγγράφων πέρα από την απλή αναγνώριση "θεμάτων": Το σύστημα πραγματοποιεί ανάλυση σε κάθε έγγραφο για να λαμβάνει πληροφορίες με βάση κείμενο και μετα-δεδομένα και μετατρέπει το περιεχόμενο σε μαθηματικό μοντέλο.

Τα δύο μαθηματικά μοντέλα – οι προτιμήσεις χρήστη και η κατανόηση του εγγράφου – μπορούν να συγκριθούν με το επιλεγμένο περιεχόμενο που είναι η πλησιέστερη αντιστοιχία για κάθε άτομο.

Εκτός από το περιεχόμενο που ταιριάζει απευθείας με κάθε χρήστη, οι αλγόριθμοι αναζητούν επίσης περιεχόμενο που εμπλέκει τους χρήστες με παρόμοιες προτιμήσεις.

Μορφοποίηση

Θέλουμε να προωθήσουμε το ποιοτικό περιεχόμενο στην τροφοδοσία μας που δεν έχει οπτικά ελαττώματα, όπως στοιχεία κεφαλίδας που λείπουν, λίστες που λείπουν, διευθύνσεις URL που λείπουν ή άσχετες λέξεις/φράσεις που έχουν ως αποτέλεσμα κακή εμπειρία χρήστη. Για να αποφύγετε την εμφάνιση περιορισμένων στοιχείων έκθεσης στο περιεχόμενό σας, βεβαιωθείτε ότι ακολουθείτε τις οδηγίες δημοσίευσης, συμπεριλαμβανομένων των εξής:

Μεγάλα μπλοκ μη μορφοποιημένου κειμένου

Το περιεχόμενο υψηλής ποιότητας και χωρίς ελαττώματα, όπως μη μορφοποιημένο κείμενο, έχει μεγαλύτερη πιθανότητα ορατότητας στην τροφοδοσία. Βεβαιωθείτε ότι έχει τη σωστή δομή και κωδικοποίηση προτάσεων και παραγράφων κατά την αποστολή. Τα άρθρα χωρίς αλλαγές γραμμών ή αλλαγών παραγράφου δεν θα προβιβαστούν στην τροφοδοσία.

Παράδειγμα μορφοποιημένου κειμένου: <p>Αυτή είναι μια παράγραφος.</p> (Σημειώστε τον κωδικό ανοίγματος και κλεισίματος).

Συνδέσεις αρχικού άρθρου

Οι συνδέσεις προς το αρχικό άρθρο μπορούν να εμφανιστούν μόνο στο κάτω μέρος του άρθρου. Οι δημοσιεύσεις που συνδέονται με το αρχικό κείμενο εντός του κύριου σώματος του κειμένου θα έχουν περιορισμένη εμβέλεια.

Διεύθυνση URL απλού κειμένου

Εάν έχετε συνδέσεις στο περιεχόμενό σας, πρέπει να βεβαιωθείτε ότι έχουν μορφοποιηθεί σωστά. Για παράδειγμα, εάν οι συνδέσεις στο περιεχόμενό σας μοιάζουν με το εξής: https://www.conotoso.com/r/linden-new-york τότε το περιεχόμενό σας δεν έχει μορφοποιηθεί σωστά και μπορεί να έχει περιορισμένη έκθεση ή να καταργηθεί ανάλογα.

Έγκυρη μορφή ημερομηνίας

Για να διασφαλίσουμε ότι το περιεχόμενό μας είναι σχετικό με τους καταναλωτές μας, πρέπει να βεβαιωθούμε ότι τα άρθρα που δείχνουμε είναι με ακρίβεια ενημερωμένα. Οι ημερομηνίες πρέπει να εκφράζονται με μορφή ημερομηνίας RFC 3339 ή RFC 822.

Έγκυρα παραδείγματα μορφής ημερομηνίας:

  • Τετ, 04 Οκτ 2017 15:00:00 +0200
  • 10-2017-04T08:00:00-05:00

Ρυθμός μετάδοσης με ένα κλικ (CTR)

Ο ρυθμός μετάδοσης με κλικ (CTR) — ο αριθμός των κλικ που διαιρούνται με τον αριθμό των εμφανίσεων — είναι ένα μέτρο δέσμευσης που χρησιμοποιείται για τον καθορισμό της κατάταξης του περιεχομένου. Το CTR επηρεάζεται κυρίως από τα στοιχεία περιεχομένου που εμφανίζονται κατά την προώθηση της σύνδεσης, συμπεριλαμβανομένου του τίτλου/τίτλου, της εικόνας και του αφηρημένου. Η εκμάθηση μηχανής κρίνει τις δυνατότητες CTR για κάθε τμήμα περιεχομένου.

Το περιεχόμενο με υψηλό CTR είναι γενικά καλό, αν και υπάρχει επίσης μια κατηγορία περιεχομένου που μπορεί να έχει υψηλό CTR, αλλά δημιουργεί επίσης δυσαρέσκεια από τους αναγνώστες - clickbait. Δείτε περισσότερα σχετικά με αυτό παρακάτω στην ενότητα μας σχετικά με τα αρνητικά σήματα.

Φρεσκάδα και επικαιρότητα

Το περιεχόμενο σε μια τροφοδοσία ειδήσεων αναμένεται να είναι "φρέσκο" και έγκαιρο. Ως αποτέλεσμα, το νεότερο περιεχόμενο κατατάσσεται υψηλότερα από το παλαιότερο περιεχόμενο, κατά μέσο όρο. Οι τελευταίες ειδήσεις, τα οικονομικά ή οι αθλητικές ιστορίες είναι σημαντικές επειδή αυτοί οι κάθετοι τείνουν να έχουν ιστορίες που γερνούν γρήγορα. Οι αλγόριθμοι αναγνωρίζουν ότι άλλα θέματα τείνουν να είναι πιο αειθαλή και επιτρέπουν σε αυτό το περιεχόμενο να είναι παλαιότερο, αναγνωρίζοντας αυτό. Το περιεχόμενο με ανακριβείς δημοσιευμένες ημερομηνίες μπορεί να κατατάσσεται χαμηλότερα.

Κατά μέσο όρο, οι ιστορίες σχετικά με δημοφιλή θέματα, τις έκτακτες ειδήσεις και τις ειδήσεις επικεφαλίδων κατατάσσονται σε μεγαλύτερη θέση. Οι κορυφαίες θέσεις στην τροφοδοσία συχνά προορίζονται για τις κορυφαίες ειδήσεις της ημέρας.

Οι τάσεις παρατηρούνται παρακολουθώντας πολλές εξωτερικές προελεύσεις δεδομένων, τόσο δημόσιες όσο και ιδιόκτητες. Το σύστημα παρακολουθεί γενικά τις τάσεις στο διαδίκτυο, καθώς και τι είναι δημοφιλές στους καμβάδες της Microsoft και την αναζήτηση Bing. Αυτά τα σήματα συνδυάζονται και χρησιμοποιούνται κατά μέσο όρο για την αξιολόγηση κάθε στοιχείου περιεχομένου ανάλογα με τις δυνατότητές του να είναι δημοφιλές. Τα στοιχεία με περισσότερες δυνατότητες κατατάσσονται υψηλότερα στην τροφοδοσία.

Αρχή εμπορικής επωνυμίας

Οι ιστορίες από γνωστούς εθνικούς ή παγκόσμιους εκδότες ειδήσεων έχουν μεγαλύτερο βάρος, επειδή οι καταναλωτές και οι εκδότες τις θεωρούν πιο έγκυρες και αξιόπιστες. Ωστόσο, οι ιστορίες από τοπικές ή λιγότερο γνωστές επωνυμίες είναι επίσης σημαντικά στοιχεία εξατομικευμένων τροφοδοσιών και συχνά κατατάσσονται σε μεγάλο βαθμό λόγω άλλων σημάτων.

Οι αλγόριθμοι δεν θεωρούν ακόμη την εξουσία ανά θέμα: για παράδειγμα, ορισμένοι εκδότες είναι πιο αξιόπιστοι στον τομέα του αθλητισμού, ενώ άλλοι ειδικεύονται στην πολιτική. Πρόκειται για έναν τομέα που η Microsoft αναμένει να βελτιώσει σε μελλοντικές ενημερώσεις κατάταξης.

Αρνητικά σήματα και clickbait

Ορισμένο περιεχόμενο δημιουργεί κλικ, αλλά δημιουργεί επίσης δυσαρέσκεια από τους χρήστες που αντιλαμβάνονται ότι ένας τίτλος είναι παραπλανητικός (δεν παρέχει το περιεχόμενο που υποσχέθηκε ο τίτλος) ή την ιστορία χαμηλότερης ποιότητας. Παραδείγματα περιλαμβάνουν τίτλους που είναι παραπλανητικοί, υπερβάλλουν την ιστορία ή είναι υπερβολικά συγκλονιστικοί ή συναισθηματικοί. Ευρέως γνωστό ως clickbait, αυτό το περιεχόμενο μπορεί να καταταχθεί χαμηλότερα με βάση τη συμπεριφορά του χρήστη που υποδηλώνει δυσαρέσκεια μέσω ενεργειών όπως ο υψηλός ρυθμός αναπήδησης.

Στα συγκεκριμένα μοτίβα περιλαμβάνονται τα εξής:

  • Ένας τίτλος που υπερβαίνει ένα teaser, ειδικά με την υπερβολική χρήση του επιρρηματικού "αυτό" (π.χ., Ποτέ μην πίνετε αυτό στο αεροπλάνο).
  • Ένας τίτλος που παραποιεί το πραγματικό περιεχόμενο ή/και την εισαγωγή της ιστορίας, αποτυγχάνοντας έτσι να ανταποκριθεί στις προσδοκίες του αναγνώστη. Μια αθετημένη υπόσχεση μπορεί να κυμαίνεται από την παράλειψη ενός περιουσιακού στοιχείου (όπως ένα βίντεο που αναφέρεται στον τίτλο) ή από το να μην αναφέρεται καθόλου στις βασικές πληροφορίες.

Περιεχόμενο που μπορεί να προκαλέσει δυσφορία

Στο πλαίσιο των συνεχών προσπαθειών μας να βελτιώσουμε την ποιότητα του περιεχομένου και να διατηρήσουμε μια θετική εμπειρία για όλους τους χρήστες, το MSN εφαρμόζει αυστηρότερα πρότυπα σε περιεχόμενο που μπορεί να θεωρηθεί προσβλητικό, γραφικό ή ακατάλληλο. Οι δημοσιεύσεις μπορεί να αποριριοποιηθούν ή να καταργηθούν εάν οι τίτλοι, οι εικόνες ή το σώμα κειμένου περιλαμβάνουν ενοχλητικό ή τιτλοθηρικό υλικό που δεν έχει ευρύτερη συντακτική ή κοινωνική συνάφεια.

Παραδείγματα περιεχομένου που μπορεί να ενεργοποιεί αυτά τα σήματα είναι τα εξής:

  • Αναλυτικές απεικονίσεις σωματικών λειτουργιών (π.χ., μετεωρισμός, περιττώματα, ούρηση, σπυράκι σκασίματα)
  • Σεξουαλικά μεταδιδόμενα νοσήματα
  • Συναντήσεις lewd (π.χ., συναντήσεις με εργαζόμενους του σεξ, δημόσιο σεξ, δημόσιο γυμνό) όπου δεν υπάρχει ευρύτερη κοινωνική σημασία, όπως ένα πολιτικό σκάνδαλο.
  • Ιστορίες εγκλήματος που περιλαμβάνουν υπερβολικές λεπτομέρειες (για παράδειγμα, τις λεπτομέρειες μιας σεξουαλικής πράξης ή μιας φρικιαστικής δολοφονίας) που υπερβαίνουν τα γυμνά γεγονότα
  • Τιτλοφορητικές ιστορίες ή ιστορίες με θέμα ενήλικες (π.χ., ρητές σεξουαλικές συμβουλές) που δεν είναι κατάλληλες για το ευρύ κοινό
  • Περιεχόμενο που αναφέρεται σε σεξουαλική απόκλιση και κτηνωρία
  • Σεξουαλική συμπεριφορά ζώων
  • Γραφική αποσύνθεση (π.χ. κρέας μολυσμένο με σκουλήκια)

Αυτός ο τύπος περιεχομένου μπορεί να μειώσει την αξιοπιστία του αναγνώστη και συχνά επισημαίνεται ως ακατάλληλος για ευρεία διανομή.

Ανάλογα με τη σοβαρότητα, το ακόλουθο περιεχόμενο μπορεί να έχει περιορισμένη έκθεση ή να έχει καταργηθεί ανάλογα, με αποτέλεσμα μείωση της εντύπωσης σε επίπεδο άρθρου:

  • Κουτσομπολιό διασημοτήτων: Τώρα περιορίζουμε την έκθεση του περιεχομένου διασημοτήτων που επικεντρώνεται (αλλά δεν περιορίζεται σε) αγώνες διασημοτήτων, σεξουαλικοποιεί τι φορούν οι διασημότητες, δυσλειτουργίες ντουλάπας, καθημερινές δραστηριότητες διασημοτήτων, θέματα σχέσεων κ.λπ. Αυτό το περιεχόμενο θα εξακολουθεί να εμφανίζεται στις σελίδες του MSN, ωστόσο, θα εκτίθεται μόνο σε χρήστες που αναζητούν αυτόν τον τύπο περιεχομένου.