Hoe MSN inhoud rangschikt

MSN publiceert nieuwsberichten, fotogalerieën en video's van duizenden uitgevers wereldwijd en promoot deze inhoud in Microsoft-producten, waaronder Microsoft Edge, Microsoft Windows, MSN.com en de mobiele MSN-app.

Telkens wanneer een consument de MSN-feed bekijkt, wordt deze vernieuwd met de nieuwste persoonlijke inhoud. Op basis van verschillende signalen selecteren en ordenen algoritmen inhoud in de feed met redactioneel toezicht. Dit classificatie-inhoudssysteem is ontworpen om te communiceren en te informeren, waarbij verhalen worden gekozen die het meest relevant zijn voor elke persoon, terwijl de inhoud ook actueel, nieuwswaardig, van hoge kwaliteit en veilig is voor werk en thuis.

Het relatieve belang van deze parameters kan variëren telkens wanneer een nieuwsfeed door een gebruiker wordt bekeken. De algoritmen ontwikkelen zich voortdurend naarmate we voortdurend signalen identificeren en verbeteren en experimenteren met nieuwe functies.

In dit artikel

Gebruikersrelevantie

Opmaak

Klikfrequentie (CTR)

Frisheid en tijdigheid

Trends en nieuwswaardigheid

Merkautoriteit

Negatieve signalen en clickbait

Gebruikersrelevantie

Microsoft levert elke consument een gepersonaliseerde nieuwsfeed om te voldoen aan de unieke set interesses en voorkeuren van elke persoon voor inhoud. De kern van deze persoonlijke instellingen zijn algoritmen die overeenkomen met gebruikersvoorkeuren met documentkennis. Deze algoritmen zijn ontworpen om de meest relevante inhoud voor elke gebruiker te selecteren.

De voorkeuren van een gebruiker worden in de loop van de tijd door het systeem geleerd door middel van twee benaderingen:

  • Expliciete persoonlijke instellingen. Het algoritme respecteert hoe gebruikers hun instellingen handmatig configureren, met inbegrip van acties zoals het volgen van bepaalde onderwerpen, het leuk vinden of niet leuk vinden van specifieke inhoud of het aangeven van een voorkeur voor een uitgever.
  • Impliciete persoonlijke instellingen. In overeenstemming met de privacy-instellingen van een gebruiker worden de verhalen geanalyseerd op patronen om de voorkeuren van de gebruiker beter te begrijpen wanneer een persoon inhoud leest en zich bezighoudt met de producten van Microsoft. De algoritmen zoeken zowel naar langetermijn- als kortetermijnpatronen voor elke gebruiker, waarbij wordt erkend dat inhoudsinteresses op de korte termijn kunnen variëren, terwijl ze verschillende langetermijntendensen vertonen. (Lees hier meer over Microsoft Privacy).

Machine learning-algoritmen stimuleren een diepgaand documentbegrip dat verder gaat dan alleen het herkennen van 'onderwerpen': het systeem voert analyses uit op elk document om inzichten te verkrijgen op basis van tekst en metagegevens en converteert de inhoud naar een wiskundig model.

De twee wiskundige modellen ( gebruikersvoorkeuren en documentinzicht ) kunnen worden vergeleken met het selecteren van inhoud die het meest overeenkomt met elke persoon.

Naast het rechtstreeks matchen van inhoud met elke gebruiker, zoeken de algoritmen ook naar inhoud die gebruikers met vergelijkbare voorkeuren benadert.

Opmaak

We willen de kwaliteitsinhoud in onze feed promoten die geen visuele defecten heeft, zoals ontbrekende koptekstelementen, ontbrekende lijstjes, ontbrekende URL's of irrelevante woorden/woordgroepen die resulteren in een slechte gebruikerservaring. Als u wilt voorkomen dat uw inhoud een beperkte zichtbaarheid krijgt, moet u de publicatierichtlijnen volgen, waaronder de volgende:

Lange blokken niet-opgemaakte tekst

Inhoud van hoge kwaliteit en zonder defecten, zoals niet-opgemaakte tekst, heeft een hogere kans om zichtbaarheid in de feed te krijgen. Zorg ervoor dat deze de juiste zins- en alineastructuur en codering heeft wanneer u deze uploadt. Artikelen zonder regeleinden of alinea-einden worden niet gepromoveerd in de feed.

Voorbeeld van opgemaakte tekst: <p>Dit is een alinea.</p> (Let op de code voor openen en sluiten).

Oorspronkelijke artikelkoppelingen

Koppelingen naar het oorspronkelijke artikel kunnen alleen onder aan het artikel worden weergegeven. Berichten die teruggaan naar het origineel in de hoofdtekst van de tekst, hebben een beperkt bereik.

URL voor tekst zonder opmaak

Als u koppelingen in uw inhoud hebt, moet u ervoor zorgen dat deze op de juiste manier zijn opgemaakt. Als koppelingen in uw inhoud er bijvoorbeeld als volgt uitzien: https://www.contoso.com/r/linden-new-york dan is uw inhoud niet correct opgemaakt en kan de zichtbaarheid beperkt zijn of dienovereenkomstig worden verwijderd.

Geldige datumnotatie

Om ervoor te zorgen dat onze inhoud relevant is voor onze consumenten, moeten we ervoor zorgen dat de artikelen die we hen tonen, nauwkeurig zijn gedateerd. Datums moeten worden uitgedrukt met de datumnotatie RFC 3339 of RFC 822.

Voorbeelden van geldige datumnotatie:

  • Woe, 04 okt 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Klikfrequentie (CTR)

Klikfrequentie (CTR) ( het aantal klikken gedeeld door het aantal vertoningen ) is een maat voor betrokkenheid die wordt gebruikt bij het bepalen van de rangschikking van inhoud. CTR wordt voornamelijk beïnvloed door de elementen van de inhoud die worden weergegeven bij het promoten van de koppeling, waaronder de titel/kop, afbeelding en abstract. Machine learning beoordeelt het CTR-potentieel voor elk stuk inhoud.

Inhoud met een hoge CTR is over het algemeen goed, hoewel er ook een categorie inhoud is die een hoge CTR kan hebben, maar ook ontevredenheid van lezers genereert - clickbait. Meer hierover vindt u hieronder in onze sectie over negatieve signalen.

Frisheid en tijdigheid

Inhoud in een nieuwsfeed is naar verwachting 'vers' en actueel. Als gevolg hiervan rangschikt nieuwere inhoud gemiddeld hoger dan oudere inhoud. Het laatste nieuws, financiële of sportverhalen zijn belangrijk omdat deze verticals vaak verhalen bevatten die snel verouderen. De algoritmen herkennen andere onderwerpen meestal meer groenblijvend en staan toe dat deze inhoud ouder is, waardoor dit wordt herkend. Inhoud met onjuiste gepubliceerde datums kan lager worden gerangschikt.

Gemiddeld worden verhalen over trending onderwerpen, het laatste nieuws en het belangrijkste nieuws beter gerangschikt. De topposities in de feed zijn vaak gereserveerd voor het belangrijkste nieuws van de dag.

Trends worden waargenomen door meerdere externe gegevensbronnen te bewaken, zowel openbaar als bedrijfseigen. Het systeem houdt in de gaten wat er trending is op internet in het algemeen, evenals wat trending is op Microsoft-canvassen en Bing-zoekopdrachten. Deze signalen worden gecombineerd en gemiddeld om elk inhoudsitem te beoordelen op het potentieel om trending te zijn. Items met meer potentieel worden hoger gerangschikt in de feed.

Merkautoriteit

Verhalen van bekende nationale of wereldwijde nieuwsuitgevers hebben een zwaarder gewicht, omdat consumenten en uitgevers ze beschouwen als gezaghebbender en vertrouwder. Verhalen van lokale of minder bekende merken zijn echter ook belangrijke onderdelen van gepersonaliseerde feeds en worden vaak hoog gerangschikt vanwege andere signalen.

De algoritmen beschouwen nog geen autoriteit per onderwerp: sommige uitgevers zijn bijvoorbeeld gezaghebbend op het gebied van sport, terwijl andere zijn gespecialiseerd in politiek. Dit is een gebied dat Microsoft verwacht te verbeteren in toekomstige classificatie-updates.

Negatieve signalen en clickbait

Sommige inhoud genereert klikken, maar genereert ook ontevredenheid van gebruikers die een kop als misleidend beschouwen (niet de beloofde inhoud leveren) of het verhaal van lagere kwaliteit. Voorbeelden hiervan zijn koppen die misleidend zijn, het verhaal overdrijven of te schokkend of emotioneel zijn. In de volksmond bekend als clickbait, kan deze inhoud lager worden gerangschikt op basis van gebruikersgedrag dat ontevredenheid suggereert via acties zoals een hoog bouncepercentage.

Specifieke patronen zijn:

  • Een kop die verder gaat dan een teaser, vooral met het overmatig gebruik van het bijwoord 'dit' (bijvoorbeeld Nooit dit drinken op een vliegtuig).
  • Een kop die de werkelijke inhoud en/of import van het verhaal onjuist weer geeft en daardoor niet voldoet aan de verwachtingen van de lezer. Een verbroken belofte kan variëren van het weglaten van een asset (zoals een video waarnaar wordt verwezen in de kop) of het helemaal niet aanpakken van de belangrijkste informatie.

Inhoud die ongemak kan veroorzaken

Als onderdeel van onze voortdurende inspanningen om de kwaliteit van de inhoud te verbeteren en een positieve ervaring voor alle gebruikers te behouden, past MSN strengere normen toe op inhoud die als aanstootgevend, grafisch of ongepast kan worden beschouwd. Berichten kunnen worden gedeprioritiseerd of verwijderd als koppen, afbeeldingen of hoofdtekst storend of prikkelend materiaal bevatten dat geen bredere redactionele of maatschappelijke relevantie heeft.

Voorbeelden van inhoud die deze signalen kan activeren, zijn:

  • Gedetailleerde afbeeldingen van lichaamsfuncties (bijvoorbeeld winderigheid, uitwerpselen, urineren, puistjespoppen)
  • Seksueel overdraagbare aandoeningen
  • Lewd ontmoet (bijvoorbeeld bijeenkomsten met sekswerkers, openbare seks, openbare naaktheid) waarbij er geen bredere maatschappelijke relevantie is, zoals een politiek schandaal.
  • Misdaadverhalen met overmatige details (bijvoorbeeld de details van een seksuele daad of een gruwelijke moord) die verder gaan dan de naakte feiten
  • Prikkelende verhalen of verhalen met een volwassenenthema (bijvoorbeeld expliciet seksueel advies) die niet geschikt zijn voor een algemeen publiek
  • Inhoud die verwijst naar seksuele afwijking en bestialiteit
  • Seksueel gedrag van dieren
  • Grafische ontleding (bijvoorbeeld vlees besmet met maden)

Dit type inhoud kan het vertrouwen van de lezer verminderen en wordt vaak gemarkeerd als ongepast voor brede distributie.

Afhankelijk van de ernst kan de volgende inhoud een beperkte blootstelling hebben of dienovereenkomstig worden verwijderd, wat leidt tot een afname van de weergave op artikelniveau:

  • Roddels van beroemdheden: We beperken nu de blootstelling van celebrity-inhoud die zich richt op (maar niet beperkt tot) beroemdhedengevechten, seksualiseren wat beroemdheden dragen, garderobeproblemen, dagelijkse activiteiten van beroemdheden, relatieproblemen, enzovoort. Deze inhoud wordt nog steeds weergegeven op MSN-pagina's, maar wordt alleen weergegeven voor gebruikers die dit type inhoud zoeken.