Wie MSN Inhalte bewertet

MSN veröffentlicht Nachrichten, Fotogalerien und Videos von Tausenden von Herausgebern weltweit und wirbt für diese Inhalte in Microsoft-Produkten, einschließlich Microsoft Edge, Microsoft Windows, MSN.com und der mobilen MSN-App.

Jedes Mal, wenn ein Consumer den MSN-Feed anzeigt, wird er mit den neuesten personalisierten Inhalten aktualisiert. Basierend auf verschiedenen Signalen wählen Algorithmen Inhalte im Feed mit redaktioneller Aufsicht aus und sortieren sie. Dieses Rangfolgen-Content-System ist darauf ausgelegt, sich zu engagieren und zu informieren, indem geschichten ausgewählt werden, die für jede Person am relevantesten sind, während gleichzeitig sichergestellt wird, dass die Inhalte aktuell, nachrichtenwürdig, qualitativ hochwertig und sicher für arbeit und zu Hause sind.

Die relative Wichtigkeit dieser Parameter kann jedes Mal variieren, wenn ein Newsfeed von einem Benutzer angezeigt wird. Die Algorithmen entwickeln sich ständig weiter, da wir ständig Signale identifizieren und verbessern und mit neuen Features experimentieren.

In diesem Artikel

Benutzer relevanz

Formatierung

Klickrate (Click-Through Rate, CTR)

Aktualität und Aktualität

Trends und Nachrichtentüchtigkeit

Markenautorität

Negative Signale und Clickbait

Benutzer relevanz

Microsoft liefert jedem Verbraucher einen personalisierten Newsfeed, um die individuellen Interessen und Vorlieben der einzelnen Personen für Inhalte zu erfüllen. Der Kern dieser Personalisierung sind Algorithmen, die Benutzereinstellungen mit Dokumentverständnis übereinstimmen. Diese Algorithmen sind so konzipiert, dass sie die relevantesten Inhalte für jeden Benutzer auswählen.

Die Einstellungen eines Benutzers werden im Laufe der Zeit vom System durch zwei Ansätze gelernt:

  • Explizite Personalisierung. Der Algorithmus berücksichtigt, wie Benutzer ihre Einstellungen manuell konfigurieren, einschließlich Aktionen wie dem Folgen bestimmter Themen, dem Liken oder Missfallen bestimmter Inhalte oder dem Angeben einer Herausgeberpräferenz.
  • Implizite Personalisierung. In Übereinstimmung mit den Datenschutzeinstellungen eines Benutzers, wenn eine Person Inhalte liest und sich mit Microsoft-Produkten beschäftigt, werden die Geschichten auf Muster analysiert, um die Präferenzen des Benutzers besser zu verstehen. Die Algorithmen suchen sowohl nach langfristigen als auch nach kurzfristigen Mustern für jeden Benutzer und erkennen an, dass die Interessen von Inhalten kurzfristig variieren können, während sie unterschiedliche langfristige Tendenzen aufweisen. (Weitere Informationen zum Microsoft-Datenschutz finden Sie hier.

Machine Learning-Algorithmen fördern ein tiefgreifendes Dokumentverständnis, das über die einfache Erkennung von "Themen" hinausgeht: Das System führt Analysen für jedes Dokument durch, um Erkenntnisse basierend auf Text und Metadaten zu erhalten, und konvertiert den Inhalt in ein mathematisches Modell.

Die beiden mathematischen Modelle – Benutzerpräferenzen und Dokumentverständnis – können mit ausgewählten Inhalten verglichen werden, die für jede Person am ehesten übereinstimmen.

Neben dem direkten Abgleich von Inhalten mit jedem Benutzer suchen die Algorithmen auch nach Inhalten, die Benutzer mit ähnlichen Vorlieben einbinden.

Formatierung

Wir möchten qualitativ hochwertige Inhalte in unserem Feed bewerben, die keine visuellen Mängel aufweisen, z. B. fehlende Headerelemente, fehlende Listen, fehlende URLs oder irrelevante Wörter/Ausdrücke, die zu einer schlechten Benutzererfahrung führen. Um zu vermeiden, dass Ihre Inhalte eingeschränkt verfügbar sind, stellen Sie sicher, dass Sie die Veröffentlichungsrichtlinien befolgen, einschließlich der folgenden:

Lange Blöcke mit unformatiertem Text

Inhalte, die von hoher Qualität sind und keine Mängel aufweisen, z. B. unformatierter Text, haben eine höhere Wahrscheinlichkeit, dass sie im Feed sichtbar werden. Stellen Sie sicher, dass sie über die richtige Satz- und Absatzstruktur und Codierung verfügt, wenn Sie sie hochladen. Artikel ohne Zeilenumbrüche oder Absatzumbrüche werden im Feed nicht höher gestuft.

Beispiel für formatierten Text: <p>Dies ist ein Absatz.</p> (Beachten Sie den öffnenden und schließenden Code).

Ursprüngliche Artikellinks

Links zurück zum ursprünglichen Artikel können nur am Ende des Artikels angezeigt werden. Beiträge, die im Haupttext des Texts mit dem Original verknüpft sind, haben eingeschränkte Reichweite.

Nur-Text-URL

Wenn Sie Links in Ihren Inhalten haben, müssen Sie sicherstellen, dass diese entsprechend formatiert sind. Für instance, wenn Links in Ihren Inhalten wie folgt aussehen: https://www.conotoso.com/r/linden-new-york dann sind Ihre Inhalte nicht richtig formatiert und haben möglicherweise eine eingeschränkte Offenlegung oder werden entsprechend entfernt.

Gültiges Datumsformat

Um sicherzustellen, dass unsere Inhalte für unsere Verbraucher relevant sind, müssen wir sicherstellen, dass die Artikel, die wir ihnen zeigen, genau datiert sind. Datumsangaben müssen im Datumsformat RFC 3339 oder RFC 822 ausgedrückt werden.

Beispiele für gültiges Datumsformat:

  • Mi, 04 Okt 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Klickrate (Click-Through Rate, CTR)

Die Klickrate (Click-Through Rate, CTR) – die Anzahl der Klicks dividiert durch die Anzahl der Aufrufe – ist ein Maß für das Engagement, das bei der Ermittlung der Rangfolge von Inhalten verwendet wird. CtR wird in erster Linie durch die Elemente des Inhalts beeinflusst, die beim Bewerben des Links angezeigt werden, einschließlich Titel/Überschrift, Bild und Abstrakt. Machine Learning bewertet das CTR-Potenzial für jeden Inhalt.

Inhalte mit hoher CTR sind im Allgemeinen gut, obwohl es auch eine Kategorie von Inhalten gibt, die eine hohe CTR aufweisen können, aber auch Unzufriedenheit beim Leser erzeugen - Clickbait. Weitere Informationen hierzu finden Sie unten in unserem Abschnitt zu negativen Signalen.

Aktualität und Aktualität

Es wird erwartet, dass inhalte in einem Newsfeed "aktuell" und aktuell sind. Daher rangieren neuere Inhalte im Durchschnitt höher als ältere Inhalte. Die neuesten Nachrichten, Finanz- oder Sportgeschichten sind wichtig, da diese Vertikalen in der Regel Geschichten haben, die schnell altern. Die Algorithmen erkennen, dass andere Themen in der Regel immergrüner sind und erlauben, dass diese Inhalte älter sind, was dies erkennt. Inhalte mit ungenauen Veröffentlichungsdaten können niedriger eingestuft werden.

Im Durchschnitt werden Geschichten über Trendthemen, aktuelle Nachrichten und Schlagzeilen höher eingestuft. Die Top-Positionen im Feed sind oft den führenden nachrichtenwürdigen Nachrichten des Tages vorbehalten.

Trends werden beobachtet, indem mehrere externe Datenquellen überwacht werden, sowohl öffentlich als auch proprietär. Das System überwacht, was im Internet im Großen und Ganzen zu beobachten ist und was auf Microsoft Canvasses und der Bing-Suche im Trend liegt. Diese Signale werden kombiniert und gemittelt, um jedes Inhaltselement auf sein Trendpotenzial zu bewerten. Elemente mit mehr Potenzial werden im Feed höher eingestuft.

Markenautorität

Geschichten von bekannten nationalen oder globalen Nachrichtenverlegern haben ein größeres Gewicht, da Verbraucher und Herausgeber sie gleichermaßen als autoritativer und vertrauenswürdiger betrachten. Geschichten von lokalen oder weniger bekannten Marken sind jedoch auch wichtige Bestandteile personalisierter Feeds und werden häufig aufgrund anderer Signale hoch eingestuft.

Die Algorithmen betrachten die Autorität noch nicht nach Thema: Einige Verlage sind beispielsweise im Bereich des Sports autoritativer, während andere sich auf Politik spezialisieren. Dies ist ein Bereich, den Microsoft in zukünftigen Bewertungsupdates verbessern wird.

Negative Signale und Clickbait

Einige Inhalte generieren Klicks, erzeugen aber auch Unzufriedenheit von Benutzern, die eine Überschrift als irreführend empfinden (nicht die Inhalte liefern, die die Überschrift versprochen hat) oder die Geschichte von niedrigerer Qualität. Beispiele hierfür sind Überschriften, die irreführend sind, die Geschichte übertreiben oder übermäßig schockierend oder emotional sind. Im Allgemeinen als Clickbait bezeichnet, kann dieser Inhalt basierend auf dem Benutzerverhalten niedriger eingestuft werden, das auf Unzufriedenheit durch Aktionen wie eine hohe Absprungrate hindeutet.

Zu den spezifischen Mustern gehören:

  • Eine Überschrift, die über einen Teaser hinausgeht, insbesondere bei der übermäßigen Verwendung des Adverbs "this" (z.B. Never Drink This on a Plane).
  • Eine Überschrift, die den tatsächlichen Inhalt der Geschichte und/oder den Import falsch darstellt und damit die Erwartungen der Leser nicht erfüllt. Eine gebrochene Zusage kann das Auslassen eines Medienobjekts (z. B. ein Video, auf das in der Überschrift verwiesen wird) oder das Nicht-Adressieren der wichtigsten Informationen reichen.

Inhalt, der Unbehagen verursachen kann

Im Rahmen unserer kontinuierlichen Bemühungen, die Qualität der Inhalte zu verbessern und eine positive Erfahrung für alle Benutzer zu gewährleisten, wendet MSN strengere Standards auf Inhalte an, die als anstößig, grafikerisch oder unangemessen wahrgenommen werden können. Beiträge können deprioritiert oder entfernt werden, wenn Überschriften, Bilder oder Textkörper störendes oder verstörendes Material enthalten, dem eine breitere redaktionelle oder gesellschaftliche Relevanz fehlt.

Beispiele für Inhalte, die diese Signale auslösen können, sind:

  • Detaillierte Darstellungen von Körperfunktionen (z.B. Blähungen, Exkrement, Wasserlassen, Pickel-Knallen)
  • Sexuell übertragbare Krankheiten
  • Lewd-Begegnungen (z. B. Treffen mit Sexarbeiterinnen, öffentlichem Sex, öffentlicher Nacktheit), bei denen es keine breitere gesellschaftliche Relevanz wie einen politischen Skandal gibt.
  • Kriminalgeschichten, die exzessive Details enthalten (für instance, die Besonderheiten einer sexuellen Handlung oder eines grausamen Mordes), die über die bloßen Fakten hinausgehen
  • Titillating- oder Erwachsenen-Themengeschichten (z.B. explizite sexuelle Beratung), die für das allgemeine Publikum nicht geeignet sind
  • Inhalte, die sich auf sexuelle Abweichungen und Bestialität beziehen
  • Sexuelles Verhalten von Tieren
  • Grafische Zerlegung (z. B. mit Maden befallenes Fleisch)

Diese Art von Inhalt kann das Vertrauen der Leser verringern und wird häufig als ungeeignet für eine breite Verbreitung gekennzeichnet.

Je nach Schweregrad können die folgenden Inhalte nur eingeschränkt verfügbar sein oder entsprechend entfernt werden, was zu einer Abnahme des Eindrucks auf Artikelebene führt:

  • Prominenter Gossip: Wir beschränken jetzt die Offenlegung von Prominenten-Inhalten, die sich auf (aber nicht beschränkt auf) Prominentenkämpfe konzentrieren, sexualisieren, was Prominente tragen, Fehlfunktionen in der Garderobe, tägliche Promi-Aktivitäten, Beziehungsprobleme usw. Dieser Inhalt wird weiterhin auf MSN-Seiten angezeigt, wird jedoch nur für Benutzer verfügbar gemacht, die diese Art von Inhalt suchen.