Kā MSN vērtē saturu

MSN publicē jaunumu rakstus, fotoattēlu galerijas un videoklipus no tūkstošiem izdevēju globāli un reklamē šo saturu visos Microsoft produktos, tostarp Microsoft Edge, Microsoft Windows, MSN.com un MSN mobilajā programmā.

Ikreiz, kad patērētājam tiek rādīta MSN plūsma, tā tiek atsvaidzināta ar jaunāko personalizēto saturu. Pamatojoties uz dažādiem signāliem, algoritmi atlasa un secību saturā, izmantojot redaktora pārraudzību. Šī vērtēšanas satura sistēma ir paredzēta, lai iesaistītos un informētu, izvēloties katrai personai visnoderīgākos rakstus, kā arī nodrošināt, lai saturs būtu laicīgs, jaunumu cienīgs, augstas kvalitātes un drošs lietošanai darbā un mājās.

Šo parametru relatīvā svarīgums var atšķirties ikreiz, kad lietotājs skata jaunumu plūsmu. Algoritmi pastāvīgi tiek pilnveidoti, kad mēs pastāvīgi identificējam un uzlabojam signālus un eksperimentam ar jauniem līdzekļiem.

Tēmas šajā rakstā

Lietotāju atbilstība

Formatēšana

Caurklikšķināšanas likme (CTR)

Svaigums un laika skalas

Tendences un jaunumu uzticamība

Zīmola iestāde

Negatīvi signāli un clickbait

Lietotāju atbilstība

Microsoft katram klientam piegādā personalizētu ziņu plūsmu, lai satiktu katras personas unikālo interešu un preferenču kopu attiecībā uz saturu. Šīs personalizācijas pamatā ir algoritmi, kas atbilst lietotāja preferencēm un dokumentu izpratnei. Šie algoritmi ir veidoti, lai atlasītu katram lietotājam vispiemērotāko saturu.

Lietotāja preferences laika gaitā sistēma tiek apgūta, izmantojot divas pieejas:

  • Tieša personalizēšana. Algoritms cēlās, kā lietotāji manuāli konfigurē savus iestatījumus, tostarp darbības, piemēram, sekošanu noteiktām tēmām, konkrēta satura ie patikam vai nepacietības vai norāda izdevēja preferenci.
  • Netieša personalizēšana. Atbilstoši lietotāja konfidencialitātes iestatījumiem, kamēr persona lasa saturu un sadarbojas ar Microsoft produktiem, raksti tiek analizēti, lai modeļi būtu vieglāk saprotami lietotāja preferencēm. Algoritmi meklējiet abus ilgtermiņa un īstermiņa modeļus katram lietotājam, apstiprinot, ka satura intereses īstermiņā var atšķirties, vienlaikus radīt dažādas ilgtermiņa tendences. (Lasiet vairāk par Microsoft konfidencialitāti šeit).

Mašīnmācīšanās algoritmi padziļināti izmanto dokumentu izpratni, nevis vienkārši atpazīst tēmas: sistēma veic analīzi katrā dokumentā, lai gūtu ieskatus, pamatojoties uz tekstu un metadatiem, un saturu pārvērš par matemātisku modeli.

Abus matemātiskos modeļus — lietotāja preferences un dokumenta izpratni — var salīdzināt, lai atlasītu saturu, kas ir vistuvākais katras personas saturs.

Papildus tiešai satura saskaņošanai ar katru lietotāju algoritmi meklē arī saturu, kas piesaista lietotājus ar līdzīgām preferencēm.

Formatēšana

Mēs vēlamies paaugstināt kvalitātes saturu mūsu plūsmā, kam nav vizuālu defektu, piemēram, trūkstoši galvenes elementi, trūkstoši listicles, trūkstoši vietrāži URL vai neatbilstoši vārdi/frāzes, kas izraisa sliktu lietotāja pieredzi. Lai izvairītos no tā, ka jūsu saturs redz ierobežotu iedarbību, pārliecinieties, vai atrodaties saskaņā ar publicēšanas vadlīnijām, tostarp šīm:

Gari neformatēta teksta bloki

Saturam, kas ir kvalitatīvs un kuram nav defektu, piemēram, neformatēta teksta, ir augstāka iespējamība, ka tas kļūst labāks par redzamību plūsmā. Pārliecinieties, vai tai ir pareiza teikuma un rindkopu struktūra un kodēšana, kad to augšupielādējat. Raksti bez rindiņu pārtraukumiem vai rindkopu pārtraukumiem plūsmā netiks paaugstināti.

Formatēta teksta piemērs: <p>Šī ir rindkopa.</p> (Pievērsiet uzmanību sākuma un beigu kodam).

Sākotnējā raksta saites

Saites atpakaļ uz sākotnējo rakstu var būt redzamas tikai raksta apakšdaļā. Ziņas, kas ir saites atpakaļ uz oriģinālu teksta pamattekstā, būs ierobežotas.

Vienkārša teksta VIETRĀDIS URL

Ja jūsu saturā ir saites, pārliecinieties, vai tās ir pareizi formatētas. Piemēram, ja jūsu satura saites izskatās šādi: https://www.conotoso.com/r/linden-new-york saturs nav pareizi formatēts un tam var būt ierobežota ekspozīcijas vieta, vai arī atbilstoši tiek noņemts.

Derīgs datuma formāts

Lai mūsu saturs būtu atbilstoša mūsu patērētājiem, mums ir jānodrošina, lai klienti varētu pareizi aprakstīt savu saturu. Datumi jānorāda, izmantojot RFC 3339 vai RFC 822 datuma formātus.

Derīgi datumu formāta piemēri:

  • 2017. gada 4. okt. 15:00:00 +0200
  • 04T08:00:00-05:00

Caurklikšķināšanas likme (CTR)

Caurklikšķināšanas likme (Click-through rate — CTR) — klikšķu skaits, kas dalīts ar iespaidu skaitu, — ir viens iesaistīšanās mērs, ko izmanto, nosakot satura vērtēšanu. CTR galvenokārt ietekmē satura elementi, kas tiek rādīti, reklamējot saiti, tostarp virsrakstu/virsrakstu, attēlu un abstrakti. Mašīnmācīšanas procesā tiek tiesnesis katra satura fragmenta VTR potenciālais.

Saturs ar lielu VTR parasti ir labs, lai gan pastāv arī satura kategorija, kurā var būt liels VTR, bet arī ģenerēta neapmierinoša darbība no lasītājiem — noklikšķiniet uzbait. Papildinformāciju skatiet tālāk mūsu sadaļā par negatīviem signāliem.

Svaigums un laika skalas

Ir paredzams, ka jaunumu plūsmas saturs būs "svaigs" un aktuāls. Rezultātā jaunākam saturam pamatā ir augstāks līmenis nekā vecākam saturam. Jaunumu, finanšu vai sporta stāstu jaunākā informācija ir svarīga, jo šīm vertikālēm parasti ir ātri stāsti par šo vecumu. Algoritmi atpazīst citas tēmas, parasti ir nenodziļinātāk un ļauj šim saturam būt vecākam, atpazīstot to. Saturs ar neprecīziem publicētiem datumiem var būt zemāks.

Parasti raksti par tendenču tēmām, jaunākām ziņām un ziņu virsrakstiem ir ierindoti augstāk. Populārākās pozīcijas plūsmā bieži ir rezervētas vadošajām jaunumu plūsmas ziņām.

Tendences novērotās, pārraugot vairākus ārējos datu avotus, gan publiskos, gan īpašumtiesību avotus. Sistēma pārrauga tendences internetā, kā arī tendences Microsoft kanvās un Bing meklēšanā. Šie signāli tiek apvienoti un iegūti ar vidējo vērtību, lai vērtētu katru satura vienumu, iespējams, tas būs tendencē. Vienumi ar lielāku iespējamo tiek novērtēti augstāk plūsmā.

Zīmola iestāde

Stāsti no plaši pazīstamiem valsts vai globāliem ziņu izdevējiem ir daudz svarīgākā, jo klienti un izdevēji tos vien var skatīt kā autoritatīvus un uzticamākus. Tomēr stāsti no vietējiem vai mazāk pazīstamiem zīmoliem ir arī svarīgi personalizētu plūsmu komponenti un bieži tiek novērtēti lielā mērā citu signālu dēļ.

Algoritmi pagaidām neuzskata autoritāti pēc tēmas: piemēram, daži izdevēji sporta jomā ir autoritatīvi, bet citi specializējas politikai. Šī ir vieta, ko Microsoft sagaida, lai uzlabotu turpmākos vērtēšanas atjauninājumus.

Negatīvi signāli un clickbait

Daži saturs ģenerē klikšķus, bet arī ģenerē neapmierinātības darbības no lietotājiem, kas uztver virsrakstu, kas ir maldinošs (nerādīt virsrakstu apsolītais saturs) vai zemākas kvalitātes stāstu. Piemēram, virsraksti ir maldinoši, pārspīlēti sižeti vai ir pārāk šokēti vai emocionāli. Šis saturs, ko plaši dēvē par Clickbait, var būt zemāks, pamatojoties uz lietotāja rīcību, kas iesaka neapmierināt darbības ar darbībām, piemēram, augsts atlēciena ātrums.

Shēmas ietver:

  • Virsraksts, kas atrodas ārpus tējas dzesētāja, it īpaši ar "šo" pārspīlēju (piemēram, nekad to nedzeriet lidmašīnu).
  • Virsraksts, kas sagroza faktisko stāsta saturu un/vai importēšanu, līdz ar to neatbilst lasītāja gaidītajam. Kļūdains uzdevums var būt aktīvs, piemēram, videoklips, uz kuru ir atsauce virsrakstā), vai galvenās informācijas adresēšana vispār.

Saturs, kas var radīt diskomfortu

Līdz ar mūsu pastāvīgajiem pūliņiem uzlabot satura kvalitāti un uzturēt pozitīvu pieredzi visiem lietotājiem, MSN lieto stingrākus standartus saturam, kas var tikt uzskatīts par aizvainojošu, grafisku vai nepiemērotu saturu. Ziņas var būt deprioritizētas vai noņemtas, ja virsrakstos, attēlos vai pamattekstā ir traucēts vai ciļņu materiāls, kam trūkst plašāka redaktora vai atbilstības.

Satura piemēri, kas var aktivizēt šos signālus, ietver:

  • Detalizēta dārgā funkciju attēlojums (piemēram, flatulence, excrement, urination, pimple popping)
  • Sexually transmitted nosūtāms
  • Lewd sastopas (piemēram, sapulces ar dzimuma darbiniekiem, publisks dzimums, publiskais kailums), kur nav plašākas sapulcēm, piemēram, ar politisku uzkāršanos.
  • Noziedzīgi stāsti, kuros ir pārmērīga detalizācijas pakāpe (piemēram, seksuālo darbību specifiskais vai glītais noliegumi), kas atrodas ārpus tiem, kas atrodas ārpus barelie faktiem
  • Tēriņa vai pieaugušā iemiesoņu stāsti (piemēram, tiešas seksuālo padomu), kas nav piemēroti vispārīgai auditorijai
  • Saturs, kas atsaucas uz seksuālo deviitāti un ģeālumi
  • Dzīvnieku seksuālo uzvedību
  • Grafisks dekompozīcija (piemēram, gaļa, kas invadēta ar maggots)

Šāda veida saturs var samazināt lasītāja uzticamību un bieži tiek atzīmēts kā nepiemērots plašai izplatīšanai.

Atkarībā no nozīmīguma tālāk sniegtā satura ekspozīcijas līmenis var būt ierobežots vai tiek atbilstoši noņemts, kā rezultātā samazinās raksta līmeņa iespaidu:

  • Atlieka gossip: Mēs tagad ierobežojam satura iedarbību, koncentrējoties uz (bet ne tikai) vesāndarbību, seksuālo kāpēšanu ar celebrities, ar disfunkciju, darbībām dienā, relāciju problēmām u.c. Šis saturs joprojām būs redzams MSN lapās, taču tiks parādīts tikai tiem lietotājiem, kas meklē šāda veida saturu.