Kako MSN rangira sadržaj

MSN objavljuje vijesti, galerije fotografija i videozapise tisuća izdavača diljem svijeta i promiče taj sadržaj u Microsoftovim proizvodima, uključujući Microsoft Edge, Microsoft Windows, MSN.com i MSN mobilnu aplikaciju.

Svaki put kada korisnik pregleda MSN sažetak sadržaja, on se osvježava najnovijim personaliziranim sadržajem. Na temelju različitih signala algoritmi odabiru i redoslijede sadržaj u sažetku sadržaja uz urednički nadzor. Ovaj sustav rangiranja sadržaja osmišljen je kako bi angažirao i informirao, odabirući priče koje su najrelevantnije za svaku osobu, a istovremeno osigurava da je sadržaj pravovremen, vrijedan vijesti, kvalitetan i siguran za posao i dom.

Relativna važnost tih parametara može se razlikovati svaki put kada korisnik pregleda sažetak sadržaja vijesti. Algoritmi se neprestano razvijaju jer neprekidno prepoznajemo i poboljšavamo signale te eksperimentiramo s novim značajkama.

Sadržaj članka

Relevantnost za korisnike

Oblikovanje

Stopa klikanja (CTR)

Svježina i aktualnost

Trendovi i novosti

Autoritet za robnu marku

Negativni signali i mamac za klikove

Relevantnost za korisnike

Microsoft svakom korisniku pruža personalizirani sažetak sadržaja vijesti koji zadovoljava jedinstveni skup interesa i preferencija za sadržaj svake osobe. U srži ove personalizacije su algoritmi koji usklađuju korisničke preferencije s razumijevanjem dokumenta. Ti su algoritmi dizajnirani za odabir najrelevantnijeg sadržaja za svakog korisnika.

Korisničke preference sustav s vremenom uči na dva pristupa:

  • Eksplicitna personalizacija. Algoritam poštuje način na koji korisnici ručno konfiguriraju svoje postavke, uključujući radnje poput praćenja određenih tema, sviđanja ili nesviđanja određenog sadržaja ili navođenja preferenci izdavača.
  • Implicitna personalizacija. U skladu s korisnikovim postavkama privatnosti, dok osoba čita sadržaj i angažira se u Microsoftovim proizvodima, priče se analiziraju radi pronalaženja uzoraka radi boljeg razumijevanja korisnikovih preferencija. Algoritmi traže i dugoročne i kratkoročne obrasce za svakog korisnika, priznajući da interesi za sadržaj mogu varirati u kratkom roku, dok pokazuju različite dugoročne tendencije. (Više o Microsoftovoj zaštiti privatnosti pročitajte ovdje).

Algoritmi strojnog učenja potiču dubinsko razumijevanje dokumenata izvan jednostavnog prepoznavanja "tema": sustav provodi analizu svakog dokumenta kako bi dobio uvide na temelju teksta i metapodataka te pretvara sadržaj u matematički model.

Dva matematička modela – korisničke preferencije i razumijevanje dokumenta – mogu se usporediti tako da se odabere sadržaj koji najviše odgovara svakoj osobi.

Osim izravnog podudaranja sadržaja sa svakim korisnikom, algoritmi također traže sadržaj koji angažira korisnike sa sličnim preferencijama.

Oblikovanje

Želimo promovirati kvalitetan sadržaj u našem sažetku sadržaja koji nema vizualne nedostatke kao što su nedostajući elementi zaglavlja, nedostajući popisi, URL-ovi ili nerelevantne riječi/izrazi koji rezultiraju lošim korisničkim iskustvom. Da biste izbjegli ograničenu izloženost sadržaja, slijedite li smjernice za objavljivanje, uključujući sljedeće:

Dugi blokovi neoblikovanog teksta

Sadržaj koji je visoke kvalitete i bez nedostataka, kao što je neoblikovani tekst, ima veću vjerojatnost da će biti vidljiv u sažetku sadržaja. Provjerite ima li odgovarajuću strukturu rečenica i odlomaka te kodiranje kada je prenosite. Članci bez prijeloma redaka ili prijeloma odlomaka neće se promovirati u sažetku sadržaja.

Primjer oblikovanog teksta: <p>Ovo je odlomak.</p> (obratite pozornost na šifru za otvaranje i zatvaranje).

Veze na izvorne članke

Veze na izvorni članak mogu se pojaviti samo pri dnu članka. Objave koje sadrže vezu na izvornik unutar glavnog tijela teksta imat će ograničen doseg.

URL običnog teksta

Ako se u sadržaju nalaze veze, moraju biti pravilno oblikovane. Na primjer, ako veze u vašem sadržaju izgledaju ovako: https://www.contoso.com/r/linden-new-york vaš sadržaj nije ispravno oblikovan i može biti ograničeno izložen ili uklonjen u skladu s tim.

Valjani oblik datuma

Da bismo bili sigurni da je naš sadržaj relevantan za naše potrošače, moramo se pobrinuti da članci koje im prikazujemo budu točno datirani. Datumi moraju biti izraženi pomoću oblika datuma RFC 3339 ili RFC 822.

Primjeri valjanih oblika datuma:

  • Srijeda, 04 lis 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Stopa klikanja (CTR)

Stopa klikanja (CTR) – broj klikova podijeljen s brojem pojavljivanja – jedna je od mjera angažmana koja se koristi za određivanje rangiranja sadržaja. Na CTR prvenstveno utječu elementi sadržaja koji se prikazuju prilikom promicanja veze, uključujući naslov/naslov, sliku i sažetak. Strojno učenje procjenjuje potencijal CTR-a za svaki dio sadržaja.

Sadržaj s visokim CTR-om općenito je dobar, iako postoji i kategorija sadržaja koji može imati visok CTR, ali i generira nezadovoljstvo čitatelja - clickbait. Pogledajte više o tome u nastavku u našem odjeljku o negativnim signalima.

Svježina i aktualnost

Očekuje se da će sadržaj u sažetku sadržaja vijesti biti "svjež" i pravovremen. Zbog toga se noviji sadržaj u prosjeku rangira više od starijeg sadržaja. Najnovije vijesti, financije ili sportske priče važne su jer ove vertikale obično imaju priče koje brzo stare. Algoritmi prepoznaju da su druge teme zimzelene i dopuštaju da ovaj sadržaj bude stariji, prepoznajući to. Sadržaj s netočnim objavljenim datumima može biti rangiran niže.

U prosjeku, priče o popularnim temama, najnovijim vijestima i naslovnim vijestima rangiraju se više. Prve pozicije u sažetku sadržaja često su rezervirane za vodeće vijesti vrijedne vijesti dana.

Trendovi se promatraju praćenjem više vanjskih izvora podataka, kako javnih tako i vlasničkih izvora. Sustav prati što je u trendu na internetu općenito, kao i što je u trendu na Microsoftovim platnima i Bing pretraživanju. Ti se signali kombiniraju i izračunavaju prosjek kako bi se svaka stavka sadržaja mogla smatrati trendom. Stavke s većim potencijalom rangiraju se više u sažetku sadržaja.

Autoritet za robnu marku

Priče poznatih nacionalnih ili globalnih izdavača vijesti imaju veću težinu, jer ih potrošači i izdavači smatraju autoritativnijima i pouzdanijima. Međutim, priče lokalnih ili manje poznatih brendova također su važne komponente personaliziranih feedova i često su visoko rangirane zbog drugih signala.

Algoritmi još ne uzimaju u obzir autoritet po temi: na primjer, neki izdavači su autoritativniji u području sporta, dok su drugi specijalizirani za politiku. To je područje koje Microsoft očekuje da će poboljšati u budućim ažuriranjima rangiranja.

Negativni signali i mamac za klikove

Neki sadržaji generiraju klikove, ali i nezadovoljstvo korisnika koji smatraju da naslov zavarava (ne isporučuje sadržaj koji je naslov obećao) ili kao priču niže kvalitete. Primjeri uključuju naslove koji zavaravaju, preuveličavaju priču ili su pretjerano šokantni ili emotivni. Popularno poznat kao mamac za klikove, ovaj sadržaj može biti rangiran niže na temelju ponašanja korisnika koje sugerira nezadovoljstvo radnjama kao što je visoka stopa napuštanja početne stranice.

Specifični uzorci uključuju sljedeće:

  • Naslov koji nadilazi teaser, pogotovo uz pretjeranu upotrebu priloga "ovo" (npr. Nikad ovo ne pij u avionu).
  • Naslov koji pogrešno predstavlja stvarni sadržaj priče i/ili uvoz, čime ne ispunjava očekivanja čitatelja. Prekršeno obećanje može sadržavati izostavljanje resursa (kao što je videozapis referenciran u naslovu) ili neadresiranje ključnih informacija.

Sadržaj koji može uzrokovati nelagodu

Kao dio naših stalnih napora za poboljšanjem kvalitete sadržaja i održavanjem pozitivnog iskustva za sve korisnike, MSN primjenjuje strože standarde na sadržaj koji se može smatrati uvredljivim, eksplicitnim ili neprikladnim. Objavama se može smanjiti prioritet ili ih ukloniti ako naslovi, slike ili tijelo teksta uključuju uznemirujuće ili uzbudljive materijale kojima nedostaje šira urednička ili društvena važnost.

Primjeri sadržaja koji mogu aktivirati te signale uključuju sljedeće:

  • Detaljni prikazi tjelesnih funkcija (npr. nadutost, izmet, mokrenje, iskakanje prištića)
  • Spolno prenosive bolesti
  • Razvratni susreti (npr. sastanci sa seksualnim radnicima, seks na javnom mjestu, javna golotinja) gdje nema šireg društvenog značaja kao što je politički skandal.
  • Kriminalističke priče koje uključuju pretjerane detalje (na primjer, specifičnosti seksualnog čina ili jezivog ubojstva) koje nadilaze gole činjenice
  • Uzbudljive priče ili priče s temom odraslih (npr. eksplicitni seksualni savjeti) nisu prikladne za opću publiku
  • Sadržaj koji se odnosi na seksualnu devijantnost i sodomiju
  • Seksualno ponašanje životinja
  • Grafička razlaga (npr. meso zaraženo crvima)

Ta vrsta sadržaja može smanjiti povjerenje čitatelja i često se označava kao neprikladna za širu distribuciju.

Ovisno o ozbiljnosti, sljedeći sadržaj može biti ograničen ili uklonjen u skladu s tim, što može dovesti do smanjenja prikaza na razini članka:

  • Tračevi o slavnim osobama: Sada ograničavamo izlaganje sadržaja slavnih osoba usredotočujući se (ali ne ograničavajući se na) svađe slavnih osoba, seksualizaciju onoga što slavne osobe nose, kvarove u garderobi, svakodnevne aktivnosti slavnih, probleme u vezama itd. Taj će se sadržaj i dalje prikazivati na stranicama MSN-a, međutim, bit će dostupan samo korisnicima koji traže tu vrstu sadržaja.