Kako MSN rangira sadržaj
MSN objavljuje vesti, galerije fotografija i video zapise hiljada izdavača globalno i promoviše ovaj sadržaj u Microsoft proizvodima, uključujući Microsoft Edge, Microsoft Windows MSN.com i MSN aplikaciju za mobilne uređaje.
Svaki put kada potrošač pregleda MSN feed, on se osvežava najnovijim personalizovanim sadržajem. Na osnovu različitih signala, algoritmi biraju i naruče sadržaj u feedu uz urednički pregled. Ovaj sistem sadržaja rangiranja dizajniran je da angažuje i informiše, bira priče koje su najrelevantnije za svaku osobu, istovremeno obezbeđujući da je sadržaj pravovremean, informativan, kvalitetan i bezbedan za posao i kuću.
Relativna važnost ovih parametara može da se razlikuje svaki put kada korisnik prikaže feed vesti. Algoritmi se uvek razvijaju kako neprestano identifikujemo i poboljšavamo signale i eksperimentišemo sa novim funkcijama.
U ovom članku
Negativni signali i baze podataka na klik
Relevantost korisnika
Microsoft svakom potrošaču isporučava personalizovan feed vesti kako bi ispunio jedinstveni skup interesovanja i željenih opcija za sadržaj svake osobe. U sustavu ove personalizacije su algoritmi koji se podudaraju sa željenim postavkama korisnika sa razumevanjem dokumenta. Ovi algoritmi su dizajnirani da izaberu najrelevantniji sadržaj za svakog korisnika.
Sistem je tokom vremena naučio željene postavke korisnika kroz dva pristupa:
- Eksplicitna personalizacija. Algoritam poštuje način na koji korisnici ručno konfigurišu postavke, uključujući radnje kao što su praćenje određenih tema, označavanje ili ne sviđanje određenog sadržaja ili označavanje željene opcije izdavača.
- Implicitna personalizacija. U skladu sa postavkama privatnosti korisnika, dok osoba čita sadržaj i bavi se Microsoft proizvodima, priče se analiziraju kako bi se bolje razumele željene postavke korisnika. Algoritami traže dugoročne i kratkoročne obrasce za svakog korisnika, priznajući da interesovanja sadržaja mogu da se razlikuju kratkoročno, dok ispoljavaju različite dugoročne tendencije. (Ovde pročitajte više o Microsoft privatnosti).
Algoritami mašinskog učenja pokreću duboka razumevanja dokumenta i ne mogu jednostavno da prepoznaju "teme": Sistem vrši analizu na svakom dokumentu kako bi stekao uvide na osnovu teksta i metapodataka i konvertuje sadržaj u matematički model.
Dva matematička modela – željene postavke korisnika i razumevanje dokumenta – mogu da se porede sa izborom sadržaja koji je najsličniji za svaku osobu.
Pored direktnog podudaranja sadržaja sa svakim korisnikom, algoritmi pretražuju i sadržaj koji korisnicima daje slične željene opcije.
Oblikovanje
Želimo da promovišemo kvalitetni sadržaj u feedu koji nema vizuelne greške kao što su elementi zaglavlja koji nedostaju, listicli koji nedostaju, nedostajuće URL adrese ili nevažne reči/fraze koje dovesti do lošeg korisničkog iskustva. Da biste izbegli da sadržaj vidi ograničeno izlaganje, proverite da li pratite uputstva za objavljivanje, uključujući sledeće:
Dugački blokovi neoblikovanog teksta
Sadržaj koji je visokog kvaliteta i bez oštećenja kao što je neoblikovani tekst ima veću verovatnoću da će biti vidljiv u feedu. Prilikom otpremanja proverite da li ima odgovarajuću strukturu rečenice i pasusa i kodiranje. Članci bez preloma redova ili preloma pasusa neće biti unapređeni u feedu.
Primer oblikovanog teksta: <p>Ovo je pasus.</p> (Obratite paћnju na otvoreni i zatvoreni kôd).
Veze do originalnog članka
Veze ka originalnom članku mogu da se pojave samo na dnu članka. Objave koje se vraćaju na original u okviru glavnog tela teksta imaće ograničen dohvat ruke.
URL čistog teksta
Ako imate veze u sadržaju, morate da se uverite da su oblikovane na odgovarajući način. Na primer, ako veze u sadržaju izgledaju ovako: https://www.conotoso.com/r/linden-new-york sadržaj nije ispravno oblikovan i možda je ograničeno izložen ili se u skladu sa tim uklanja.
Važeći format datuma
Da bismo se uverili da je naš sadržaj relevantan za naše potrošače, moramo da se uverimo da su članci koje im pokazujemo tačni datumi. Datumi se moraju izraziti pomoću RFC 3339 ili RFC 822 formata datuma.
Važeći primeri formata datuma:
- Wed, 04 okt 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Brzina klika (CTR)
Brzina klika (CTR) – broj kli ova dva klika podeljen brojem utisaka – predstavlja meru angažovanja koja se koristi za određivanje rangiranja sadržaja. Na CTR prvenstveno utiču elementi sadržaja koji se prikazuju prilikom promovisanja veze, uključujući naslov/naslov, sliku i sažetke. Mašinsko učenje procenjuje potencijal CTR-a za svaki deo sadržaja.
Sadržaj sa visokim CTR-om generalno je dobar, iako postoji i kategorija sadržaja koji može da ima visoku CTR vrednost, ali takođe generiše nezadovoljnje čitalaca – kliknibait. Pogledajte više o ovome u nastavku u našem odeljku na Negativni signali.
Ažuriranost i vreme
Očekuje se da će sadržaj u razmeni sadržaja diskusionih grupa biti "svež" i na vreme. Kao rezultat toga, noviji sadržaj je u proseku viši od starijeg sadržaja. Najnovije vesti, finansije ili sportske priče su važne jer te vertikalne vertikalne imaju priče tog uzrasta tako brzo. Algoritmi prepoznaju druge teme su uvek sve agresivnije i omogućavaju da ovaj sadržaj bude stariji i prepoznaju ga. Sadržaj sa netačnim objavljenim datumima može biti rangiran niže.
Trendovi i pohvale za vesti
Priče o temama u trendu, najnovijim vestima i vestima iz naslova su u proseku rangirane više. Najvažnije pozicije u feedu često su rezervisane za vodeće vesti danas.
Trendovi se posmatraju nadgledanjem više spoljnih izvora podataka, kako javnih tako i lokalnih. Sistem nadgleda opšti trend na internetu, kao i ono što je u trendu na Microsoft platnama i Bing pretrazi. Ovi signali se kombinuju i procenjuju se u proseku kako bi ocenili svaku stavku sadržaja na osnovu njenog potencijala da bude u trendu. Stavke sa većim potencijalom rangirane su na višem mestu u feedu.
Autoritet brenda
Priče poznatih nacionalnih ili globalnih izdavača vesti imaju veću težinu, jer ih potrošači i izdavači isto vide kao pouzdanije i pouzdanije. Međutim, priče lokalnih ili manje poznatih brendova takođe su važne komponente personalizovanih feedova i često su rangirane visoko zbog drugih signala.
Algoritmi još uvek ne smatraju autoritet po temama: na primer, neki izdavači su pouzdaniji u oblasti sporta, dok su drugi specijalizovani za politiku. Ovo je oblast u koju Microsoft očekuje da će se poboljšati u budućim ispravkama rangiranja.
Negativni signali i baze podataka na klik
Neki sadržaj generiše klikove, ali takođe generiše nezadovoljovanje korisnika koji dožive da naslov obmanjuje (ne isporučivanje sadržaja obećanog naslova) ili rubriku nižeg kvaliteta. Primeri uključuju naslove koji su obmanjivani, preterujući ili su preterano šokantni ili emotivni. Ovaj sadržaj koji se popularno naziva "clickbait", može biti rangiran niže na osnovu ponašanja korisnika koje sugeriše nezadovoljnost putem radnji kao što je visoka stopa odskoka.
Određeni obrasci uključuju:
- Naslov koji prevazilazi zakucavanje, naročito sa prekoračenim korišćenjem priloga "ovo" (npr. nikada ne pij ovo u avionu).
- Naslov koji pogrešno predstavlja stvarni sadržaj rubrike i/ili uvozi, na taj način ne ispunjava očekivanja čitalaca. Neispravno obećanje može da se razlikuje od izostavljanja resursa (kao što je video zapis na koji se upućuje u naslovu) ili ne adresiranja ključnih informacija.
Sadržaj koji može da izazove nelagodu
U sklopu naših tekućih napora da poboljšamo kvalitet sadržaja i održimo pozitivno iskustvo za sve korisnike, MSN primenjuje strože standarde na sadržaj koji se može smatrati uvredljivim, grafičkim ili neprikladnim. Objave mogu biti uklonjene ili uklonjene ako naslovi, slike ili tekst tela uključuju uznemiravajući ili prisilni materijal koji nema širu uređivačku ili socijalnu relevantnost.
Primeri sadržaja koji mogu da aktiviraju ove signale uključuju:
- Detaljni prikazi telesnih funkcija (npr. ravnanje, izrezivanje, uriniranje, iskakanje prstima)
- Seksualno prenete bolesti
- Lewd susrete (npr. sastanke sa seksualnim radnicima, javni seks, javnu golotinju) gde ne postoji šira socijalna relevantnost kao što je politički skandal.
- Priče o kriminalu koje sadrže suvišne detalje (na primer, detalje seksualnog čina ili jezivog ubistva) koje prevazilaze gole činjenice
- Titillating or adult-themed stories (npr. eksplicitni seksualni savet) nije prikladan za opštu publiku
- Sadržaj koji upućuje na seksualnu devijaciju i bestijalnost
- Seksualno ponašanje životinja
- Grafički raščlanjivanje (npr. meso preliveno crvima)
Ovaj tip sadržaja može da smanji poverenje čitalaca i često je označen zastavicom kao neprikladan za široku raspodelu.
U zavisnosti od ozbiljnosti, sledeći sadržaj može imati ograničenu izloženost ili uklonjen u skladu sa ovim, što će dovodi do smanjenja utiska na nivou članka:
- Tračare poznatih ličnosti: sada ograničavamo izlaganje sadržaja poznatih liиnosti fokusiranih (ali ne ograniиeno na) svaрe sa poznatim liиnostima, seksualnost toga љto poznate liиnosti nose, neslaganja sa garderobom, svakodnevnim aktivnostima poznatih liиnosti, problemima u vezi itd. Ovaj sadržaj će se i dalje pojavljivati na MSN stranicama, ali će biti izložen samo korisnicima koji traže ovaj tip sadržaja.