Hvordan MSN rangerer innhold
MSN publiserer nyhetssaker, fotogallerier og videoer fra tusenvis av utgivere globalt og fremmer dette innholdet på tvers av Microsoft-produkter, inkludert Microsoft Edge, Microsoft Windows, MSN.com og MSN-mobilappen.
Hver gang en forbruker viser MSN-feeden, oppdateres den med det nyeste tilpassede innholdet. Basert på ulike signaler velger og ordner algoritmer innhold i feeden med redaksjonelt tilsyn. Dette rangeringsinnholdssystemet er utformet for å engasjere og informere, velge historier som er mest relevante for hver person, samtidig som du sikrer at innholdet er rettidig, nyhetsverdig, høy kvalitet og trygt for arbeid og hjemmebruk.
Den relative betydningen av disse parameterne kan variere hver gang en nyhetsfeed vises av en bruker. Algoritmene utvikler seg alltid etter hvert som vi kontinuerlig identifiserer og forbedrer signaler og eksperimenterer med nye funksjoner.
I denne artikkelen
Gjennomklikkingsfrekvens (CTR)
Negative signaler og clickbait
Brukerrelevans
Microsoft leverer hver forbruker en personlig nyhetsfeed for å møte hver persons unike sett med interesser og preferanser for innhold. Kjernen i denne tilpasningen er algoritmer som samsvarer med brukerinnstillinger med dokumentforståelse. Disse algoritmene er utformet for å velge det mest relevante innholdet for hver bruker.
En brukers preferanser læres over tid av systemet gjennom to fremgangsmåter:
- Eksplisitt tilpasning. Algoritmen respekterer hvordan brukere konfigurerer innstillingene manuelt, inkludert handlinger som å følge bestemte emner, like eller disliking bestemt innhold, eller angi en utgiverinnstillinger.
- Implisitt tilpassing. I samsvar med en brukers personverninnstillinger, som en person leser innhold og engasjerer seg i Microsofts produkter, analyseres historiene for mønstre for å bedre forstå brukerens preferanser. Algoritmene ser både etter langsiktige og kortsiktige mønstre for hver bruker, og erkjenner at innholdsinteresser kan variere på kort sikt, samtidig som de viser ulike langsiktige tendenser. (Les mer om Microsofts personvern her).
Maskinlæringsalgoritmer driver dyp dokumentforståelse utover bare å gjenkjenne "emner": Systemet utfører analyser på hvert dokument for å få innsikt basert på tekst og metadata og konverterer innholdet til en matematisk modell.
De to matematiske modellene – brukerinnstillinger og dokumentforståelse – kan sammenlignes med å velge innhold som er det nærmeste samsvaret for hver person.
I tillegg til direkte samsvarende innhold med hver bruker, søker algoritmene også etter innhold som engasjerer brukere med lignende preferanser.
Formatering
Vi ønsker å fremheve kvalitetsinnholdet i feeden vår som ikke har noen visuelle defekter som manglende topptekstelementer, manglende listikler, manglende nettadresser eller irrelevante ord/uttrykk som resulterer i en dårlig brukeropplevelse. Hvis du vil unngå at innholdet ser begrenset eksponering, må du kontrollere at du følger retningslinjene for publisering, inkludert følgende:
Lange blokker med uformatert tekst
Innhold som har høy kvalitet og uten defekter, for eksempel uformatert tekst, har høyere sannsynlighet for å få synlighet i feeden. Kontroller at den har riktig setnings- og avsnittsstruktur og koding når du laster den opp. Artikler uten linjeskift eller avsnittsskift blir ikke forfremmet i feeden.
Eksempel på formatert tekst: <p>Dette er et avsnitt.</p> (Legg merke til åpnings- og sluttkoden).
Opprinnelige artikkelkoblinger
Koblinger tilbake til den opprinnelige artikkelen kan bare vises nederst i artikkelen. Innlegg som kobler tilbake til originalen i hovedteksten i teksten, har begrenset rekkevidde.
URL-adresse for ren tekst
Hvis du har koblinger i innholdet, må du kontrollere at de er riktig formatert. Hvis koblinger i innholdet for eksempel ser slik ut: https://www.conotoso.com/r/linden-new-york er ikke innholdet riktig formatert og kan ha begrenset eksponering eller fjernes tilsvarende.
Gyldig datoformat
For å sikre at innholdet vårt er relevant for forbrukerne våre, må vi sørge for at artiklene vi viser dem er nøyaktig datert. Datoer må uttrykkes ved hjelp av RFC 3339- eller RFC 822-datoformater.
Eksempler på gyldig datoformat:
- Ons, 04 Okt 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Gjennomklikkingsfrekvens (CTR)
Gjennomklikkingsfrekvens (CTR) – antall klikk delt på antall visninger – er ett mål på forhandling som brukes til å bestemme innholdsrangering. CTR påvirkes hovedsakelig av elementene i innhold som vises når du promoterer koblingen, inkludert tittel/overskrift, bilde og abstrakt. Maskinlæring vurderer CTR-potensialet for hver innholdsdel.
Innhold med høy CTR er generelt bra, selv om det også er en kategori av innhold som kan ha høy CTR, men genererer også misnøye fra leserne - clickbait. Se mer om dette nedenfor i vårt avsnitt om negative signaler.
Friskhet og aktualitet
Innhold i en nyhetsfeed forventes å være «friskt» og betimelig. Som et resultat rangeres nyere innhold høyere enn eldre innhold, i gjennomsnitt. De siste i nyheter, økonomi eller sportshistorier er viktige fordi disse vertikalene har en tendens til å ha historier som eldes raskt. Algoritmene gjenkjenner andre emner pleier å være mer eviggrønne og tillater at dette innholdet blir eldre, og erkjenner det. Innhold med unøyaktige publiserte datoer kan rangeres lavere.
Trender og nyhetsverdighet
I gjennomsnitt rangeres historier om populære emner, siste nytt og overskriftsnyheter høyere. De øverste posisjonene i feeden er ofte reservert for dagens ledende nyhetsverdige nyheter.
Trender observeres ved å overvåke flere eksterne datakilder, både offentlige og rettighetsbeskyttede. Systemet overvåker hva som er populært på Internett for øvrig, samt hva som er populært på Microsoft-lerreter og Bing-søk. Disse signalene kombineres og beregnes i gjennomsnitt for å vurdere hvert innholdselement på potensialet til å være populært. Elementer med større potensial rangeres høyere i feeden.
Merkeautoritet
Historier fra kjente nasjonale eller globale nyhetsutgivere har en tyngre vekt, fordi både forbrukere og utgivere ser dem som mer autoritative og pålitelige. Historier fra lokale eller mindre kjente merkevarer er imidlertid også viktige komponenter i tilpassede feeder og rangeres ofte høyt på grunn av andre signaler.
Algoritmene anser ennå ikke autoritet etter emne: for eksempel er noen utgivere mer autoritative innen idrett, mens andre spesialiserer seg på politikk. Dette er et område Microsoft forventer å forbedre i fremtidige rangeringsoppdateringer.
Negative signaler og clickbait
Noe innhold genererer klikk, men genererer også misnøye fra brukere som oppfatter en overskrift for å være misvisende (ikke levere innholdet overskriften lovet) eller historien om lavere kvalitet. Eksempler inkluderer overskrifter som er villedende, overdriver historien eller er altfor sjokkerende eller følelsesmessige. Populært kjent som clickbait, kan dette innholdet rangeres lavere basert på brukeratferd som antyder misnøye gjennom handlinger som høy sprettfrekvens.
Spesifikke mønstre omfatter:
- En overskrift som går utover en teaser, spesielt med overforbruk av adverb "dette" (f.eks. Aldri drikk dette på et fly).
- En overskrift som gir en feilaktig fremstilling av det faktiske artikkelinnholdet og/eller importen, og dermed ikke oppfyller leserforventningene. Et brutt løfte kan variere fra å utelate en ressurs (for eksempel en video som det refereres til i overskriften) eller ikke adressere nøkkelinformasjonen i det hele tatt.
Innhold som kan forårsake ubehag
Som en del av vår kontinuerlige innsats for å forbedre innholdskvaliteten og opprettholde en positiv opplevelse for alle brukere, bruker MSN strengere standarder for innhold som kan oppfattes som støtende, grafisk eller upassende. Innlegg kan deprioriteres eller fjernes hvis overskrifter, bilder eller brødtekst inkluderer forstyrrende eller spennende materiale som mangler bredere redaksjonell eller samfunnsmessig relevans.
Eksempler på innhold som kan utløse disse signalene inkluderer:
- Detaljerte skildringer av kroppsfunksjoner (f.eks. flatulens, ekskrementer, vannlating, kvise popping)
- Seksuelt overførbare sykdommer
- Uanstendige møter (f.eks. møter med sexarbeidere, offentlig sex, offentlig nakenhet) der det ikke er noen bredere samfunnsrelevans som en politisk skandale.
- Krimhistorier som inkluderer overdreven detalj (for eksempel detaljene i en seksuell handling eller et grusomt mord) som går utover de nakne fakta
- Titillating eller voksen-tema historier (f.eks, eksplisitte seksuelle råd) ikke passer for generelle publikum
- Innhold som refererer til seksuell avvik og bestialitet
- Seksuell atferd for dyr
- Grafisk nedbrytning (f.eks. kjøtt infisert med maggots)
Denne typen innhold kan redusere leserklareringen og flagges ofte som upassende for bred distribusjon.
Avhengig av alvorsgraden kan følgende innhold ha begrenset eksponering eller fjernet tilsvarende, noe som fører til en reduksjon i inntrykket på artikkelnivå:
- Kjendissladder: Vi begrenser nå eksponeringen av kjendisinnhold som fokuserer på (men ikke begrenset til) kjendiskamper, seksualiserer hva kjendiser har på seg, garderobefeil, daglige kjendisaktiviteter, relasjonsproblemer osv. Dette innholdet vises fremdeles på MSN-sider, men blir bare eksponert for brukere som søker etter denne typen innhold.