Sådan rangerer MSN indhold

MSN udgiver nyhedshistorier, fotogallerier og videoer fra tusindvis af udgivere globalt og promoverer dette indhold på tværs af Microsoft-produkter, herunder Microsoft Edge, Microsoft Windows, MSN.com og MSN-mobilappen.

Hver gang en forbruger får vist MSN-feedet, opdateres det med det senest tilpassede indhold. Baseret på forskellige signaler vælger algoritmer og bestiller indhold i feedet med redaktionelt tilsyn. Dette rangeringsindholdssystem er designet til at engagere og informere, vælge historier, der er de mest relevante for hver person, og samtidig sikre, at indholdet er rettidigt, nyhedsværdigt, af høj kvalitet og sikkert til arbejde og hjem.

Den relative betydning af disse parametre kan variere, hver gang et nyhedsfeed vises af en bruger. Algoritmerne udvikler sig hele tiden, efterhånden som vi løbende identificerer og forbedrer signaler og eksperimenterer med nye funktioner.

Denne artikel indeholder

Brugerlevans

Formatering

Klikfrekvens (CTR)

Friskhed og aktualitet

Tendenser og nyhedsdygtighed

Varemærkemyndighed

Negative signaler og clickbait

Brugerlevans

Microsoft leverer et personligt nyhedsfeed til alle forbrugere for at imødekomme hver enkelt persons unikke sæt interesser og præferencer for indhold. Kernen i denne tilpasning er algoritmer, der matcher brugerpræferencer med dokumentforståelse. Disse algoritmer er designet til at vælge det mest relevante indhold for hver bruger.

En brugers præferencer læres over tid af systemet ved hjælp af to metoder:

  • Eksplicit tilpasning. Algoritmen respekterer, hvordan brugerne manuelt konfigurerer deres indstillinger, herunder handlinger som f.eks. at følge bestemte emner, synes godt om eller afvise bestemt indhold eller angiver en foretrukket udgiver.
  • Implicit tilpasning. I overensstemmelse med en brugers indstillinger for beskyttelse af personlige oplysninger, når en person læser indhold og interagerer med Microsofts produkter, analyseres historierne for mønstre for bedre at forstå brugerens præferencer. Algoritmerne søger både efter langsigtede og kortsigtede mønstre for hver bruger, idet de anerkender, at indholdsinteresser kan variere på kort sigt, mens de udviser forskellige langsigtede tendenser. (Læs mere om Microsofts beskyttelse af personlige oplysninger her).

Maskinlæringsalgoritmer giver en dyb dokumentforståelse ud over blot at genkende "emner": Systemet udfører analyser af hvert dokument for at få indsigt baseret på tekst og metadata og konverterer indholdet til en matematisk model.

De to matematiske modeller – brugerpræferencer og dokumentforståelse – kan sammenlignes med det valgte indhold, der passer bedst til hver person.

Udover direkte matchende indhold med hver enkelt bruger søger algoritmerne også efter indhold, der engagerer brugere med lignende præferencer.

Formatering

Vi vil gerne fremhæve kvalitetsindholdet i vores feed, der ikke har visuelle fejl som manglende sidehovedelementer, manglende listeikler, manglende URL-adresser eller irrelevante ord/sætninger, der giver en dårlig brugeroplevelse. Hvis du vil undgå, at dit indhold ser begrænset eksponering, skal du sørge for at følge publiceringsretningslinjerne, herunder følgende:

Lange blokke med uformateret tekst

Indhold, der er af høj kvalitet og uden fejl, f.eks. uformateret tekst, har større sandsynlighed for at få synlighed i feedet. Sørg for, at den har den rette sætning og afsnitsstruktur og kodning, når du uploader den. Artikler uden linjeskift eller afsnitsskift fremhæves ikke i feedet.

Eksempel på formateret tekst: <p>Dette er et afsnit.</p> (Bemærk åbnings- og slutkoden).

Links til oprindelige artikler

Links tilbage til den oprindelige artikel kan kun vises nederst i artiklen. Indlæg, der linker tilbage til originalen i tekstens hovedtekst, har begrænset rækkevidde.

URL-adresse til almindelig tekst

Hvis du har links i dit indhold, skal du kontrollere, at de er formateret korrekt. Hvis links i dit indhold f.eks. ser sådan ud: https://www.conotoso.com/r/linden-new-york er dit indhold ikke formateret korrekt og kan have begrænset eksponering eller blive fjernet tilsvarende.

Gyldigt datoformat

For at sikre, at vores indhold er relevant for vores forbrugere, skal vi sørge for, at de artikler, vi viser dem, er korrekt dateret. Datoer skal udtrykkes ved hjælp af RFC 3339- eller RFC 822-datoformater.

Eksempler på gyldigt datoformat:

  • Wed, 04. oktober 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Klikfrekvens (CTR)

Klikfrekvens – antallet af klik divideret med antallet af visninger – er en måling af engagementet, der bruges til at bestemme rangering af indhold. CTR påvirkes primært af de elementer af indhold, der vises, når du promoverer linket, herunder titel/overskrift, billede og abstrakt. Maskinlæring vurderer CTR-potentialet for hvert indhold.

Indhold med høj CTR er generelt godt, selvom der også er en kategori af indhold, der kan have høj CTR, men også genererer utilfredshed fra læsere - clickbait. Se mere om dette nedenfor i vores afsnit om negative signaler.

Friskhed og aktualitet

Indhold i et nyhedsfeed forventes at være "frisk" og rettidigt. Derfor rangerer nyere indhold i gennemsnit højere end ældre indhold. De seneste nyheder, finans- eller sportshistorier er vigtige, fordi disse vertikaler har en tendens til at have historier, der bliver ældre hurtigt. Algoritmerne genkender andre emner, der har tendens til at være mere stedsegrønne og tillader, at dette indhold bliver ældre og anerkender det. Indhold med unøjagtige publicerede datoer kan være rangeret lavere.

I gennemsnit er historier om populære emner, de seneste nyheder og overskriftsnyheder rangeret mere højt. Toppositionerne i feedet er ofte reserveret til dagens førende nyhedsnyheder.

Tendenser observeres ved at overvåge flere eksterne datakilder, både offentlige og beskyttede. Systemet overvåger, hvad der er populært på internettet som helhed, samt hvad der er populært på Microsoft-lærreder og Bing-søgning. Disse signaler kombineres og beregnes gennemsnit for at bedømme hvert indholdselement ud fra dets potentielle tendens. Elementer med mere potentiale er rangeret højere i feedet.

Varemærkemyndighed

Historier fra kendte nationale eller globale nyhedsudgivere har en tungere vægt, fordi både forbrugere og udgivere betragter dem som mere autoritative og pålidelige. Historier fra lokale eller mindre kendte mærker er dog også vigtige komponenter i tilpassede feeds og er ofte rangeret meget på grund af andre signaler.

Algoritmerne overvejer endnu ikke autoritet efter emne: For eksempel er nogle udgivere mere autoritative inden for sport, mens andre specialiserer sig i politik. Dette er et område, som Microsoft forventer at forbedre i fremtidige opdateringer af rangering.

Negative signaler og clickbait

Noget indhold genererer klik, men genererer også utilfredshed fra brugere, der opfatter en overskrift som vildledende (ikke at levere det indhold, som overskriften lovede) eller historien om lavere kvalitet. Eksempler omfatter overskrifter, der er vildledende, overdriver historien eller er alt for chokerende eller følelsesmæssige. Populært kendt som clickbait, kan dette indhold være rangeret lavere baseret på brugeradfærd, der antyder utilfredshed gennem handlinger som høj bounce rate.

Bestemte mønstre omfatter:

  • En overskrift, der går ud over en teaser, især med overforbrug af den adverb "dette" (f.eks. Aldrig Drikke dette på et fly).
  • En overskrift, der forvansker den faktiske historieindhold og/eller import, og som dermed ikke lever op til læserens forventninger. Et brudt løfte kan variere fra at udelade et aktiv (f.eks. en video, der refereres til i overskriften) eller slet ikke at adressere de vigtige oplysninger.

Indhold, der kan forårsage ubehag

Som en del af vores fortsatte bestræbelser på at forbedre indholdskvaliteten og opretholde en positiv oplevelse for alle brugere anvender MSN strengere standarder for indhold, der kan opfattes som stødende, grafisk eller upassende. Indlæg kan blive afprioriteret eller fjernet, hvis overskrifter, billeder eller brødtekst indeholder forstyrrende eller titillerende materiale, der mangler bredere redaktionel eller samfundsmæssig relevans.

Eksempler på indhold, der kan udløse disse signaler, omfatter:

  • Detaljerede skildringer af kropslige funktioner (f.eks. flatulens, ekskrement, vandladning, bums popping)
  • Seksuelt overførte sygdomme
  • Uanstændige møder (f.eks. møder med sexarbejdere, offentligt sex, offentlig nøgenhed), hvor der ikke er nogen bredere samfundsmæssig relevans som f.eks. en politisk skandale.
  • Kriminalitetshistorier, der indeholder overdrevne detaljer (f.eks. detaljerne i en seksuel handling eller et grusomt mord), der går ud over de blotte fakta
  • Titillerende historier eller historier med voksentema (f.eks. eksplicit seksuel rådgivning), der ikke er passende for almindelige målgrupper
  • Indhold, der refererer til seksuel afvigelse og bestialitet
  • Dyrs seksuelle adfærd
  • Grafisk opdeling (f.eks. kød, der er angrebet af maddiker)

Denne type indhold kan reducere læsertilliden og markeres ofte som upassende til bred distribution.

Afhængigt af alvorsgraden kan følgende indhold have begrænset eksponering eller fjernet tilsvarende, hvilket fører til et reduceret indtryk på artikelniveau:

  • Celebrity sladder: Vi er nu at begrænse eksponering af berømthed indhold med fokus på (men ikke begrænset til) berømthed kampe, sexualizing hvad berømtheder er iført, garderobe funktionsfejl, dag til dag berømthed aktiviteter, forholdet spørgsmål, osv. Dette indhold vises stadig på MSN-sider, men vil kun blive vist for brugere, der søger denne type indhold.