Kā MSN vērtē saturu

MSN publicē ziņu rakstus, fotoattēlu galerijas un video no tūkstošiem izdevēju visā pasaulē un reklamē šo saturu visos Microsoft produktos, tostarp Microsoft Edge, Microsoft Windows, MSN.com un MSN mobilajā programmā.

Ikreiz, kad lietotājs skata MSN plūsmu, tā tiek atsvaidzināta ar jaunāko personalizēto saturu. Pamatojoties uz dažādiem signāliem, algoritmi atlasa un sakārto saturu plūsmā ar redakcionālo uzraudzību. Šī ranžēšanas satura sistēma ir izstrādāta, lai iesaistītu un informētu, izvēloties katrai personai visatbilstošākos stāstus, vienlaikus nodrošinot, ka saturs ir savlaicīgs, ziņu cienīgs, kvalitatīvs un drošs darbam un mājām.

Šo parametru relatīvais nozīmīgums var atšķirties ikreiz, kad lietotājs skata ziņu plūsmu. Algoritmi pastāvīgi attīstās, jo mēs pastāvīgi identificējam un uzlabojam signālus un eksperimentējam ar jauniem līdzekļiem.

Tēmas šajā rakstā

Lietotāju atbilstība

Formatēšana

Vidējais klikšķu skaits (VKS)

Svaigums un savlaicīgums

Tendences un ziņu cienīgums

Zīmola autoritāte

Negatīvi signāli un klikšķu ēsma

Lietotāju atbilstība

Microsoft nodrošina katram patērētājam personalizētu ziņu plūsmu, kas atbilst katra lietotāja unikālajām interesēm un preferencēm attiecībā uz saturu. Šīs personalizācijas pamatā ir algoritmi, kas atbilst lietotāju vēlmēm un dokumentu izpratnei. Šie algoritmi ir paredzēti, lai atlasītu katram lietotājam visatbilstošāko saturu.

Lietotāja preferences sistēma laika gaitā apgūst, izmantojot divas pieejas:

  • Tieša personalizēšana. Algoritms respektē to, kā lietotāji manuāli konfigurē savus iestatījumus, tostarp tādas darbības kā sekošana noteiktām tēmām, konkrēta satura atzīmēšana ar Patīk vai nepatīk vai izdevēja preferences norādīšana.
  • Netiešā personalizēšana. Saskaņā ar lietotāja konfidencialitātes iestatījumiem, kad persona lasa saturu un izmanto Microsoft produktus, stāsti tiek analizēti, lai atrastu modeļus, lai labāk izprastu lietotāja preferences. Algoritmi meklē gan ilgtermiņa, gan īstermiņa modeļus katram lietotājam, atzīstot, ka satura intereses īstermiņā var atšķirties, vienlaikus uzrādot atšķirīgas ilgtermiņa tendences. (Lasiet vairāk par Microsoft konfidencialitāti šeit).

Mašīnmācīšanās algoritmi nodrošina dziļu dokumentu izpratni ne tikai par "tēmu" atpazīšanu: sistēma veic katra dokumenta analīzi, lai iegūtu ieskatus, pamatojoties uz tekstu un metadatiem, un pārvērš saturu matemātiskā modelī.

Abi matemātiskie modeļi — lietotāja preferences un dokumenta izpratne — var tikt salīdzināti, lai atlasītu saturu, kas visprecīzāk atbilst katrai personai.

Papildus tiešai satura saskaņošanai ar katru lietotāju, algoritmi meklē arī saturu, kas piesaista lietotājus ar līdzīgām preferencēm.

Formatēšana

Mēs vēlamies savā plūsmā reklamēt kvalitatīvu saturu, kuram nav vizuālu defektu, piemēram, trūkst galvenes elementu, trūkst sarakstu, trūkst vietrāžu URL vai neatbilstošu vārdu/frāžu, kas pasliktina lietotāja pieredzi. Lai izvairītos no ierobežotas satura redzamības, pārliecinieties, ka ievērojat publicēšanas vadlīnijas, tostarp tālāk norādītās.

Gari neformatēta teksta bloki

Augstas kvalitātes saturam bez defektiem, piemēram, neformatētam tekstam, ir lielāka varbūtība, ka plūsmā tas tiks parādīts. Pārliecinieties, vai augšupielādes laikā tam ir pareiza teikumu un rindkopu struktūra un kodējums. Raksti bez rindiņu pārtraukumiem vai rindkopu pārtraukumiem plūsmā netiks reklamēti.

Formatēta teksta piemērs: <p>Šī ir rindkopa.</p> (Pievērsiet uzmanību sākuma un beigu kodam).

Oriģinālo rakstu saites

Saites uz oriģinālo rakstu var parādīties tikai raksta apakšā. Ziņām, kurās teksta galvenajā daļā ir saites uz oriģinālu, būs ierobežota sasniedzamība.

Vienkārša teksta vietrādis URL

Ja jūsu saturā ir saites, pārliecinieties, vai tās ir pareizi formatētas. Piemēram, ja saites jūsu saturā izskatās šādi: https://www.contoso.com/r/linden-new-york tad jūsu saturs nav pareizi formatēts un var būt ierobežoti redzams vai attiecīgi noņemts.

Derīgs datuma formāts

Lai nodrošinātu, ka mūsu saturs ir atbilstošs mūsu patērētājiem, mums ir jāpārliecinās, ka raksti, kurus viņiem parādām, ir precīzi datēti. Datumi jānorāda, izmantojot RFC 3339 vai RFC 822 datuma formātus.

Derīgu datuma formātu piemēri:

  • Trešdiena, 04 Okt 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Vidējais klikšķu skaits (VKS)

Klikšķu skaits (VKS) (klikšķu skaits, dalīts ar seansu skaitu) ir viens no iesaistes rādītājiem, ko izmanto satura ranga noteikšanā. VNA galvenokārt ietekmē satura elementi, kas tiek parādīti, reklamējot saiti, tostarp virsraksts/virsraksts, attēls un kopsavilkums. Mašīnmācīšanās novērtē VKS potenciālu katram satura elementam.

Saturs ar augstu VKS parasti ir labs, lai gan ir arī satura kategorija, kurai var būt augsts VKS, bet arī rada lasītāju neapmierinātību - clickbait. Vairāk par to skatiet mūsu sadaļā par negatīvajiem signāliem.

Svaigums un savlaicīgums

Gaidāms, ka jaunumu plūsmas saturs būs "svaigs" un savlaicīgs. Tā rezultātā jaunāks saturs vidēji ierindojas augstāk nekā vecāks saturs. Jaunākie ziņu, finanšu vai sporta stāsti ir svarīgi, jo šajās vertikālēs mēdz būt stāsti, kas ātri noveco. Algoritmi atpazīst citas tēmas, kas mēdz būt mūžzaļākas, un ļauj šim saturam būt vecākam, to atzīstot. Saturs ar neprecīziem publicēšanas datumiem var tikt novērtēts zemāk.

Vidēji stāsti par populārām tēmām, jaunākajām ziņām un virsrakstu ziņām tiek vērtēti augstāk. Augstākās pozīcijas plūsmā bieži ir rezervētas dienas vadošajām ziņu ziņām.

Tendences tiek novērotas, uzraugot vairākus publiskos un patentētos ārējos datu avotus. Sistēma uzrauga, kādas tendences ir internetā kopumā, kā arī Microsoft kanvas un Bing meklēšanas tendences. Šie signāli tiek apvienoti un aprēķināti vidēji, lai novērtētu katru satura vienumu pēc tā potenciāla popularitātes. Vienumi ar lielāku potenciālu plūsmā tiek ierindoti augstāk.

Zīmola autoritāte

Stāsti no labi pazīstamiem nacionālajiem vai globālajiem ziņu izdevējiem ir smagāks, jo patērētāji un izdevēji tos uzskata par autoritatīvākiem un uzticamākiem. Tomēr vietējo vai mazāk pazīstamu zīmolu stāsti ir arī svarīgas personalizēto plūsmu sastāvdaļas, un tie bieži tiek novērtēti augstu citu signālu dēļ.

Algoritmi vēl neņem vērā autoritāti pēc tēmas: piemēram, daži izdevēji ir autoritatīvāki sporta jomā, bet citi specializējas politikā. Šo jomu Microsoft plāno uzlabot turpmākajos reitinga atjauninājumos.

Negatīvi signāli un klikšķu ēsma

Daļa satura rada klikšķus, bet arī rada neapmierinātību no lietotājiem, kuri uzskata, ka virsraksts ir maldinošs (nenodrošina solīto saturu) vai stāsts ir zemākas kvalitātes. Piemēram, virsraksti, kas ir maldinoši, pārspīlē stāstu vai ir pārlieku šokējoši vai emocionāli. Šis saturs, kas pazīstams kā clickbait, var tikt ierindots zemāk, pamatojoties uz lietotāju uzvedību, kas liecina par neapmierinātību, izmantojot tādas darbības kā augsts atlēcienu līmenis.

Tālāk norādīti konkrēti modeļi.

  • Virsraksts, kas pārsniedz teaser, it īpaši, ja pārmērīgi tiek izmantots apstākļa vārds "šis" (piemēram, nekad nedzeriet šo lidmašīnā).
  • Virsraksts, kas nepareizi atspoguļo faktisko stāsta saturu un/vai importu, tādējādi neapmierinot lasītāju cerības. Pārkāpts solījums var būt no aktīva (piemēram, video, uz kuru ir atsauce virsrakstā) izlaišanas vai vispār nepievēršas galvenajai informācijai.

Saturs, kas var radīt diskomfortu

Kā daļa no mūsu pastāvīgajiem centieniem uzlabot satura kvalitāti un uzturēt pozitīvu pieredzi visiem lietotājiem, MSN lieto stingrākus standartus saturam, ko var uztvert kā aizvainojošu, atklātu vai nepiemērotu. Ziņām var tikt noņemta prioritāte vai tās var tikt noņemtas, ja virsrakstos, attēlos vai pamattekstā ir satraucošs vai aizkaitinošs materiāls, kam nav plašākas redakcionālas vai sociālas nozīmes.

Satura, kas var aktivizēt šos signālus, piemēri ir minēti tālāk.

  • Detalizēts ķermeņa funkciju attēlojums (piemēram, vēdera uzpūšanās, ekskrementi, urinēšana, pūtītes uzsprāgšana)
  • Seksuāli transmisīvās slimības
  • Nepieklājīgas tikšanās (piemēram, tikšanās ar seksa darbiniekiem, publisks sekss, publisks kailums), kur nav plašākas sabiedrības nozīmes, piemēram, politisks skandāls.
  • Noziegumu stāsti, kas ietver pārmērīgas detaļas (piemēram, seksuāla akta vai šausmīgas slepkavības specifiku), kas pārsniedz tukšus faktus
  • Aizraujoši vai pieaugušajiem paredzēti stāsti (piemēram, nepārprotami seksuāla rakstura padomi), kas nav piemēroti plašai auditorijai
  • Saturs, kas atsaucas uz seksuālu novirzi un zvērestību
  • Dzīvnieku seksuālā uzvedība
  • Grafiskā sadalīšanās (piem., gaļa, kas inficēta ar burvīm)

Šāda veida saturs var mazināt lasītāju uzticēšanos un bieži tiek atzīmēts kā nepiemērots plašai izplatīšanai.

Atkarībā no nozīmīguma tālāk norādītajam saturam var būt ierobežota iedarbība vai attiecīgi noņemts, kā rezultātā raksta līmeņa skatījums samazinās.

  • Slavenību tenkas: Mēs tagad ierobežojam slavenību satura atklāšanu, koncentrējoties uz slavenību cīņām (bet ne tikai), slavenību valkāšanas seksualizēšanu, garderobes darbības traucējumiem, ikdienas slavenību aktivitātēm, attiecību jautājumiem utt. Šis saturs joprojām būs redzams MSN lapās, taču tas būs redzams tikai tiem lietotājiem, kuri meklē šāda veida saturu.