Hur MSN rangordnar innehåll
MSN publicerar nyheter, fotogallerier och videor från tusentals utgivare globalt och marknadsför det här innehållet i Microsoft-produkter, bland annat Microsoft Edge, Microsoft Windows, MSN.com och MSN-mobilappen.
Varje gång en konsument visar MSN-feeden uppdateras den med det senaste personliga innehållet. Baserat på olika signaler väljer och beställer algoritmer innehåll i feeden med redaktionell tillsyn. Detta rankningsinnehållssystem är utformat för att engagera och informera, välja berättelser som är mest relevanta för varje person, samtidigt som det säkerställer att innehållet är lägligt, nyhetsvärdigt, högkvalitativt och säkert för arbete och hem.
Parametrarnas relativa betydelse kan variera varje gång en användare tittar på ett nyhetsflöde. Algoritmerna utvecklas alltid när vi kontinuerligt identifierar och förbättrar signaler och experimenterar med nya funktioner.
Artikelinnehåll
Negativa signaler och clickbait
Användarrelevans
Microsoft ger varje konsument ett anpassat nyhetsflöde för att möta varje persons unika uppsättning intressen och inställningar för innehåll. Kärnan i den här anpassningen är algoritmer som matchar användarpreferenser med dokumentförståldning. De här algoritmerna är utformade för att välja det mest relevanta innehållet för varje användare.
En användares inställningar lärs över tid av systemet genom två metoder:
- Explicit anpassning. Algoritmen respekterar hur användare manuellt konfigurerar sina inställningar, inklusive åtgärder som att följa vissa ämnen, gilla eller ogilla specifikt innehåll eller ange en utgivares inställning.
- Implicit anpassning. I enlighet med en användares sekretessinställningar analyseras artiklarna för att bättre förstå användarens inställningar när en person läser innehåll och kommunicerar med Microsofts produkter. Algoritmerna letar både efter långsiktiga och kortsiktiga mönster för varje användare, och erkänner att innehållsintressen kan variera på kort sikt, samtidigt som de uppvisar olika långsiktiga tendenser. (Läs mer om Microsoft Privacy här).
Maskininlärningsalgoritmer driver djup dokumentförståldring bortom att helt enkelt känna igen "ämnen": Systemet utför analys på varje dokument för att få insikter baserade på text och metadata och konverterar innehållet till en matematisk modell.
De två matematiska modellerna – användarpreferenser och dokumentförstrollning – kan jämföras med att välja innehåll som är den närmaste matchningen för varje person.
Förutom att direkt matcha innehåll med varje användare söker algoritmerna också efter innehåll som engagerar användare med liknande inställningar.
Formatering
Vi vill framhäva kvalitetsinnehållet i vår feed som inte har några visuella defekter som saknade rubrikelement, saknade listikoner, saknade URL:er eller irrelevanta ord/fraser som ger en dålig användarupplevelse. För att undvika att ditt innehåll får se begränsad exponering ska du se till att du följer publiceringsriktlinjerna, inklusive följande:
Långa block med oformaterad text
Innehåll som är av hög kvalitet och utan fel, till exempel oformaterad text, har en högre sannolikhet att få synlighet i feeden. Kontrollera att den har rätt menings- och styckestruktur och kodning när du laddar upp den. Artiklar utan radbrytningar eller styckebrytningar framhävs inte i feeden.
Exempel på formaterad text: <p>Det här är ett stycke.</p> (Observera öppnings- och avslutningskoden).
Ursprungliga artikellänkar
Länkar tillbaka till den ursprungliga artikeln kan bara visas längst ned i artikeln. Inlägg som länkar tillbaka till originalet i textens huvuddel har begränsad räckvidd.
Url till oformaterad text
Om du har länkar i innehållet måste du se till att de är formaterade på rätt sätt. Om länkar i innehållet till exempel ser ut så här: https://www.conotoso.com/r/linden-new-york så formateras inte innehållet korrekt och kan ha begränsad exponering eller tas bort i enlighet därmed.
Giltigt datumformat
För att säkerställa att vårt innehåll är relevant för våra konsumenter måste vi se till att artiklarna vi visar dem är korrekt daterade. Datum måste uttryckas med datumformaten RFC 3339 eller RFC 822.
Giltiga exempel på datumformat:
- Ons, 04 okt 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Klickfrekvens (CTR)
Klickfrekvens (CTR) – antalet klick som divideras med antalet visningar – är ett mått på engagemang som används för att fastställa rangordningen av innehåll. CTR påverkas främst av elementen i innehåll som visas när länken marknadsförs, inklusive rubrik/rubrik, bild och abstrakt. Maskininlärning bedömer CTR-potentialen för varje innehållsdel.
Innehåll med hög CTR är i allmänhet bra, även om det också finns en kategori av innehåll som kan ha hög CTR men också genererar missnöje från läsare - clickbait. Se mer om detta nedan i vårt avsnitt om negativa signaler.
Friskhet och aktualitet
Innehållet i ett nyhetsflöde förväntas vara "nytt" och i tid. Därför rangordnas nyare innehåll högre än äldre innehåll i genomsnitt. Det senaste inom nyheter, finans eller sporthistorier är viktiga eftersom dessa vertikaler tenderar att ha berättelser som åldras snabbt. Algoritmerna känner igen andra ämnen tenderar att vara mer vintergröna och tillåter detta innehåll att vara äldre, med tanke på det. Innehåll med felaktiga publicerade datum kan rangordnas lägre.
Trender och nyhetsvärdighet
I genomsnitt rankas berättelser om populära ämnen, senaste nyheter och huvudnyheter högre. De högsta positionerna i feeden är ofta reserverade för dagens ledande nyhetsvärdiga nyheter.
Trender observeras genom övervakning av flera externa datakällor, både offentliga och egna. Systemet övervakar vad som är populärt på internet i stort, liksom vad som är populärt på Microsoft-arbetsytor och Bing-sökning. Dessa signaler kombineras och beräknas i genomsnitt för att betygsätta varje innehållsobjekt utifrån dess potential att trenda. Objekt med större potential rankas högre i feeden.
Varumärkesmyndighet
Berättelser från välkända nationella eller globala nyhetsutgivare har en tyngre vikt, eftersom både konsumenter och utgivare ser dem som mer auktoritativa och betrodda. Berättelser från lokala eller mindre välkända varumärken är dock också viktiga komponenter i anpassade feeds och rankas ofta högt på grund av andra signaler.
Algoritmerna överväger ännu inte auktoritet efter ämne: till exempel är vissa utgivare mer auktoritativa inom sportområdet, medan andra specialiserar sig på politik. Detta är ett område som Microsoft förväntar sig att förbättra i framtida rankningsuppdateringar.
Negativa signaler och clickbait
En del innehåll genererar klick, men genererar också missnöje från användare som uppfattar en rubrik som missvisande (att inte leverera det innehåll som den utlovade rubriken) eller berättelsen om lägre kvalitet. Exempel är rubriker som är vilseledande, överdriver historien eller är alltför chockerande eller känslomässiga. Det här innehållet, som kallas clickbait, kan rangordnas lägre baserat på användarbeteende som tyder på missnöje genom åtgärder som hög icke-leveransfrekvens.
Specifika mönster är:
- En rubrik som går utöver en teaser, särskilt med överanvändningen av adverben "this" (t.ex. Never Drink This on a Plane).
- En rubrik som förvränger det faktiska berättelseinnehållet och/eller importen och därmed inte uppfyller läsarens förväntningar. Ett brutet löfte kan variera från att utelämna en tillgång (till exempel en video som refereras i rubriken) eller att inte ta itu med nyckelinformationen alls.
Innehåll som kan orsaka obehag
Som en del av vårt pågående arbete med att förbättra innehållets kvalitet och upprätthålla en positiv upplevelse för alla användare tillämpar MSN striktare standarder på innehåll som kan uppfattas som stötande, grafiskt eller olämpligt. Inlägg kan deprioriteras eller tas bort om rubriker, bilder eller brödtext inkluderar störande eller kittlande material som saknar bredare redaktionell eller samhällsrelevans.
Exempel på innehåll som kan utlösa dessa signaler är:
- Detaljerade skildringar av kroppsfunktioner (t.ex. flatulens, utsöndring, urinering, finnar som poppar)
- Sexuellt överförbara sjukdomar
- Oanständiga möten (t.ex. möten med sexarbetare, offentligt kön, offentlig nakenhet) där det inte finns någon bredare samhällsrelevans, till exempel en politisk skandal.
- Brottshistorier som inkluderar överdrivna detaljer (till exempel detaljerna i en sexuell handling eller ett ohyggligt mord) som går utöver de nakna fakta
- Berättelser med titillerande eller vuxentema (t.ex. uttryckliga sexuella råd) som inte är lämpliga för allmän målgrupp
- Innehåll som refererar till sexuell avvikande och bestialitet
- Djur sexuellt beteende
- Grafisk nedbrytning (t.ex. kött som angripits av maskar)
Den här typen av innehåll kan minska läsarens förtroende och flaggas ofta som olämpligt för bred distribution.
Beroende på allvarlighetsgrad kan följande innehåll ha begränsad exponering eller tas bort i enlighet därmed, vilket leder till en minskning av exponering på artikelnivå:
- Kändisskvaller: Vi begränsar nu exponering av kändisinnehåll som fokuserar på (men inte begränsat till) kändiskamper, sexualiserar vad kändisar bär, garderobsfel, dagliga kändisaktiviteter, relationsproblem etc. Det här innehållet visas fortfarande på MSN-sidor, men visas bara för användare som söker den här typen av innehåll.