Kako MSN razvršča vsebino

MSN objavlja novice, galerije s fotografijami in videoposnetke več tisoč izdajateljev po vsem svetu ter to vsebino promovira v vseh Microsoftovih izdelkih, vključno z brskalnikom Microsoft Edge, sistemom Microsoft Windows, sistemom MSN.com in mobilno aplikacijo MSN.

Vsakič ko si potrošnik ogleda vir MSN, se osveži z najnovejšo prilagojeno vsebino. Na podlagi različnih signalov algoritmi izbrali in naročili vsebino v viru z uredniškim nadzorom. Ta sistem vsebine razvrstitve je zasnovan tako, da omogoča sodelovanje in obveščanje, izbira zgodb, ki so najpomembnejše za vsako osebo, hkrati pa zagotavlja pravočasnost vsebine, novice, visoko kakovost in varno za delo in dom.

Relativni pomen teh parametrov se lahko razlikuje vsakič, ko si uporabnik ogleda vir novic. Algoritmi se vedno razvijajo, ko nenehno prepoznamo in izboljšujemo signale ter preskušamo nove funkcije.

V tem članku

Ustreznost uporabnika

Oblikovanje

Hitrost med kliki (CTR)

Svežina in pravočasnost

Trendi in novice

Brand authority

Negativni signali in clickbait

Ustreznost uporabnika

Microsoft vsakemu potrošniku zagotavlja prilagojen vir novic, ki ustreza enoličnim interesom in željam posamezne osebe za vsebino. Na dnu tega prilagajanja so algoritmi, ki se ujemajo z uporabniškimi nastavitvami z razumevanjem dokumenta. Ti algoritmi so zasnovani tako, da izbrali najosnejšo vsebino za vsakega uporabnika.

Uporabnikove nastavitve se sčasoma sistem nauči na dva načina:

  • Eksplicitno prilagajanje. Algoritem upošteva, kako uporabniki ročno konfigurirajo svoje nastavitve, vključno z dejanji, kot so sledite določenim temam, všečkate ali onemogočite določeno vsebino ali pa označujete prednostne nastavitve izdajatelja.
  • Implicitno prilagajanje. V skladu z nastavitvami zasebnosti uporabnika, ko oseba bere vsebino in sodeluje z Microsoftovimi izdelki, so zgodbe analizirane za vzorce, da se bolje razume uporabnikove nastavitve. Algoritmi poiščejo dolgoročne in kratkoročne vzorce za vsakega uporabnika, pri tem pa priznavajo, da se lahko zanimanja glede vsebine kratkoročno razlikujejo, medtem ko se kažejo različne dolgoročne težnje. (Več o Microsoftovi zasebnosti preberite tukaj).

Algoritmi za strojno učenje se še bolj poglobijo v razumevanje dokumenta, ne pa le prepoznavanja »tem«: Sistem izvede analizo v vsakem dokumentu, da pridobi vpoglede na podlagi besedila in metapodatkov ter pretvori vsebino v matematični model.

Dva matematična modela – uporabniške nastavitve in razumevanje dokumentov – lahko primerjate z izbrano vsebino, ki se najbolj ujema za vsako osebo.

Poleg tega, da se vsebine neposredno ujemajo s posameznim uporabnikom, algoritmi tudi dostopate do vsebine, ki uporabnike pritegne s podobnimi nastavitvami.

Oblikovanje

Spodbujati želimo kakovost vsebine v viru, ki nima vizualnih napak, kot so manjkajoči elementi glave, manjkajoči seznami, manjkajoči URL-ji ali pomembne besede/besedne zveze, ki privedejo do slabe uporabniške izkušnje. Če ne želite, da bi bila vaši vsebini prikazana omejena izpostavljenost, sledite navodilom za objavljanje, vključno s temi:

Dolgi bloki neoblikovanega besedila

Vsebina, ki je visoko kakovostna in brez napak, kot je neoblikovano besedilo, ima večjo verjetnost, da bo vidljivost v viru vidna. Prepričajte se, da ima pravilno strukturo stavka in odstavka ter kodiranje, ko ga prenesete. Članki brez prelomov vrstic ali prelomov odstavkov ne bodo povišani v viru.

Primer oblikovanega besedila: <p>To je odstavek.</p> (Upoštevajte kodo za odpiranje in zapiranje).

Povezave do izvirnega članka

Povezave do izvirnega članka so lahko prikazane le na dnu članka. Objave, ki se povežejo nazaj v izvirnik v glavnem telesu besedila, bodo dosegle omejen doseg.

URL navadnega besedila

Če imate v vsebini povezave, se morate prepričati, da so ustrezno oblikovane. Če so na primer povezave v vsebini videti tako: https://www.conotoso.com/r/linden-new-york vsebina ni pravilno oblikovana in ima lahko omejeno izpostavljenost ali pa bo ustrezno odstranjena.

Veljavna oblika zapisa datuma

Da bi zagotovili, da bo naša vsebina pomembna za naše potrošnike, moramo zagotoviti, da so članki, ki jim jih prikazujemo, točni z datumom. Datumi morajo biti izraženi z obliko zapisa datuma RFC 3339 ali RFC 822.

Veljavni primeri oblike zapisa datuma:

  • Wed, 04. oktober 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Hitrost med kliki (CTR)

Mera od klikov (CTR) – število klikov, deljenih s številom prikazov – je ena od meril ukrepanja, ki se uporablja pri določanju razvrstitve vsebine. Na CTR vplivajo predvsem elementi vsebine, ki so prikazani pri promociji povezave, vključno z naslovom/naslovom, sliko in abstraktnim besedilom. Strojno učenje sodi v potencial CTR-a za vsak del vsebine.

Vsebina z visoko CTR je na splošno dobra, čeprav obstaja tudi kategorija vsebine, ki imajo lahko visok CTR, ampak tudi ustvarja nezadovoljstvo od bralcev - clickbait. Več o tem preberite v razdelku o negativnih signalih.

Svežina in pravočasnost

Vsebina v viru novic bo po pričakovanjih »sveža« in pravočasna. Novejša vsebina se zato v povprečju razvrsti višje od starejše vsebine. Najnovejše novice, finance ali športne zgodbe so pomembne, saj imajo te navpičnice pogosto zgodbe, ki se hitro s starostjo let. Algoritmi prepoznajo druge teme so ponavadi vedno bolj zimzelena in omogočajo, da je ta vsebina starejša in jo prepozna. Vsebina z nenatančnimi objavljenimi datumi je lahko uvrščena nižje.

V povprečju so zgodbe o najbolj priljubljenih temah, najbolj priljubljenih novicah in naslovnih novicah uvrščene bolj visoko. Glavna mesta v viru so pogosto rezervirana za vodilne novice dneva.

Trende spremljamo s spremljanjem več zunanjih podatkovnih virov, tako javnih kot lastniških. Sistem spremlja, kaj je najbolj priljubljenega v internetu na ravni interneta, pa tudi, kaj je najbolj priljubljenega v Microsoftovih očalih in iskanju v storitvi Bing. Ti signali se kombinirajo in izračunajo povprečje, da ocenijo vsak element vsebine glede na svoj potencial, da je najbolj priljubljene. Elementi z več možnimi elementi so v viru uvrščeni višje.

Brand authority

Zgodbe dobro znanih nacionalnih ali globalnih založnikov novic imajo veliko težo, saj jih tako potrošniki kot založniki vidijo kot bolj avtoritativne in zaupanja vredne. Vendar pa so zgodbe lokalnih ali manj znanih blagovnih znamk tudi pomembne komponente prilagojenih virov in so pogosto uvrščene visoko zaradi drugih signalov.

Algoritmi še ne menijo organ po temi: na primer, nekateri založniki so bolj avtoritativni na področju športa, medtem ko drugi specializirajo v politiki. To je področje, ki ga Microsoft pričakuje, da se bo izboljšal v prihodnjih posodobitvah razvrstitve.

Negativni signali in clickbait

Nekatere vsebine ustvarijo klike, ampak tudi nezadovoljstvo uporabnikov, ki menijo, da je naslov zavajajoč (ne podaja vsebine je obljubljen naslov) ali zgodbo o nižji kakovosti. Primeri vključujejo naslove, ki so zavajajoči, pretiravajo v zgodbi ali so preveč šokantni ali čustveni. Popularno znan kot clickbait, ta vsebina se lahko razvrsti nižje glede na vedenje uporabnika, ki predlaga nezadovoljstvo z dejanji, kot so visoka stopnja nezmožnosti.

Določeni vzorci vključujejo:

  • Naslov, ki presega teaser, še posebej zaradi prekomerne uporabe prislovnega določila »this« (npr. Never Drink This on a Plane).
  • Naslov, ki napačno predstavlja dejansko vsebino zgodbe in/ali uvoz, zaradi česar ni mogoče izpolniti pričakovanj bralca. Nedelujoča obljuba lahko obsega obseg izpuščanja sredstva (na primer videoposnetka, na katerega se sklicuje naslov) ali pa ne obravnava ključnih informacij.

Vsebina, ki lahko povzroči nelagodje

MSN v okviru prizadevanj za izboljšanje kakovosti vsebine in ohranjanje pozitivne izkušnje za vse uporabnike uporablja strožje standarde za vsebino, ki je lahko zaznana kot žaljiva, grafična ali neprimerna. Objave so lahko prikrajšane ali odstranjene, če naslovi, slike ali telo besedila vključujejo moteče ali titrialne materiale, ki nimajo širše uredniške ali družbene pomembnosti.

Primeri vsebine, ki lahko sproži te signale:

  • Podrobne upodobitve telesne funkcije (npr. flatulence, iztrebki, uriniranje, mozolj popping)
  • Spolno prenosljive bolezni
  • Na srečanjih s spolnimi delavci, javnim seksom, javno goloto, kjer ni širše družbene pomembnosti, kot je politični škandal, naletijo na težave.
  • Kriminalne zgodbe, ki vključujejo pretirane podrobnosti (na primer podrobnosti o spolnem dejanju ali grozljivem umoru), ki presegajo gola dejstva
  • Zgodbe z joški ali odrasle (npr. eksplicitne spolne nasvete), ki niso primerne za splošno občinstvo
  • Vsebina, ki se sklicuje na spolni odmik in bestiality
  • Živalsko spolno vedenje
  • Grafično razpadanje (npr. meso, preplavano z ličami)

Ta vrsta vsebine lahko zmanjša zaupanje bralnika in je pogosto označena kot neprimerna za široko porazdelitev.

Glede na resnost ima lahko naslednja vsebina omejeno izpostavljenost ali jo ustrezno odstrani, posledica tega pa je lahko zmanjšanje prikaza na ravni članka:

  • Celebrity obrekovanja: Zdaj smo omejevanje izpostavljenosti slaven vsebine osredotoča na (vendar ne omejeno na) slaven bori, sexualizing kaj celebrities nosijo, garderobo okvare, dan v dan slaven dejavnosti, težave odnos, itd. Ta vsebina bo še vedno prikazana na straneh MSN, vendar bo prikazana le uporabnikom, ki iščejo to vrsto vsebine.