Kuinka MSN arvioi sisältöä

MSN julkaisee uutisia, valokuvagallerioita ja videoita tuhansilta julkaisijoilta maailmanlaajuisesti ja mainostaa tätä sisältöä microsoft-tuotteissa, kuten Microsoft Edgessä, Microsoft Windowsissa, MSN.com ja MSN-mobiilisovelluksessa.

Aina kun kuluttaja tarkastelee MSN-syötettä, se päivittyy uusimmalla mukautetulla sisällöllä. Erilaisten signaalien perusteella algoritmit valitsevat ja tilaavat syötteen sisältöä toimituksellisella valvonnalla. Tämä luokitussisältöjärjestelmä on suunniteltu osallistumaan ja tiedottamaan, valitsemaan tarinoita, jotka ovat merkityksellisimpiä kullekin henkilölle, ja varmistamaan samalla, että sisältö on ajankohtaista, uutisarvoista, korkealaatuista ja turvallista työtä ja kotia varten.

Näiden parametrien suhteellinen merkitys voi vaihdella aina, kun käyttäjä katsoo uutissyötettä. Algoritmit kehittyvät aina, kun tunnistamme ja parannamme jatkuvasti signaaleja ja kokeilemme uusia ominaisuuksia.

Artikkelin sisältö

Käyttäjän osuvuus

Muotoilu

Läpi napsautusnopeus (CTR)

Tuoreus ja ajantasaisuus

Trendit ja uutiskelpoisuus

Brändin viranomainen

Negatiiviset signaalit ja clickbait

Käyttäjän osuvuus

Microsoft toimittaa jokaiselle kuluttajalle mukautetun uutissyötteen, joka vastaa kunkin henkilön yksilöllisiä kiinnostuksen kohteita ja sisältöasetuksia. Tämän mukauttamisen ytimessä ovat algoritmit, jotka vastaavat käyttäjäasetuksia ja asiakirjan ymmärtämistä. Nämä algoritmit on suunniteltu valitsemaan kullekin käyttäjälle sopivin sisältö.

Järjestelmä oppii käyttäjän asetukset ajan mittaan kahdella tavalla:

Eksplisiittinen mukauttaminen. Algoritmi kunnioittaa sitä, miten käyttäjät määrittävät asetukset manuaalisesti, mukaan lukien toiminnot, kuten tiettyjen aiheiden seuraaminen, tietyn sisällön pitäminen tai tykkääminen tai julkaisijan asetusten ilmaiseminen.
Implisiittinen mukauttaminen. Käyttäjän tietosuoja-asetusten mukaisesti, kun henkilö lukee sisältöä ja käyttää Microsoftin tuotteita, tarinat analysoidaan, jotta voidaan ymmärtää paremmin käyttäjän asetukset. Algoritmit etsivät sekä pitkän aikavälin että lyhyen aikavälin malleja kullekin käyttäjälle ja tunnustavat, että sisältöintressit voivat vaihdella lyhyellä aikavälillä, mutta niissä on erilaisia pitkän aikavälin suuntauksia. (Lisätietoja Microsoftin tietosuojasta on täällä).

Koneoppimisalgoritmit edistävät asiakirjan syvällistä ymmärtämistä sen lisäksi, että ne tunnistavat vain "aiheet": Järjestelmä suorittaa analyysin kustakin asiakirjasta saadakseen tietoja tekstin ja metatietojen perusteella ja muuntaa sisällön matemaattiseksi malliksi.

Kahta matemaattista mallia – käyttäjäasetuksia ja asiakirjan ymmärtämistä – voidaan verrata valittuun sisältöön, joka vastaa parhaiten kutakin henkilöä.

Sen lisäksi, että algoritmit vastaavat sisältöä suoraan kunkin käyttäjän kanssa, ne etsivät myös sisältöä, joka sitouttaa käyttäjät, joilla on samanlaiset asetukset.

Muotoilu

Haluamme edistää syötteen laatusisältöä, jossa ei ole visuaalisia vikoja, kuten puuttuvat otsikkoelementit, puuttuvat luettelot, puuttuvat URL-osoitteet tai epäolennaiset sanat/lauseet, jotka johtavat huonoon käyttökokemukseen. Jos haluat, että sisältösi altistuminen ei ole rajoitettua, varmista, että noudatat julkaisuohjeita, kuten seuraavia:

Muotoilemattoman tekstin pitkät lohkot

Sisällöllä, joka on korkealaatuista ja jossa ei ole virheitä, kuten muotoilematon teksti, on suurempi todennäköisyys saada syötteen näkyvyys. Varmista, että siinä on oikea virke- ja kappalerakenne ja koodaus, kun lataat sen. Artikkeleita, joissa ei ole rivin- tai kappaleenvaihtoja, ei siirretä syötteessä.

Esimerkki muotoillusta tekstistä: <p>Tämä on kappale.</p> (Huomaa avaus- ja lopetuskoodi).

Alkuperäiset artikkelilinkit

Linkit takaisin alkuperäiseen artikkeliin voivat näkyä vain artikkelin alareunassa. Julkaisut, jotka linkittävät takaisin alkuperäiseen tekstiosassa, ovat rajoitetusti käytettävissä.

Tekstimuotoinen URL-osoite

Jos sisällössäsi on linkkejä, varmista, että ne on muotoiltu oikein. Jos esimerkiksi sisältösi linkit näyttävät tältä: https://www.contoso.com/r/linden-new-york, sisältöäsi ei ole muotoiltu oikein ja se voi altistua rajoitetusti tai se voidaan poistaa vastaavasti.

Kelvollinen päivämäärämuoto

Varmistaaksemme, että sisältömme on olennaista kuluttajillemme, meidän on varmistettava, että heille näyttämämme artikkelit on päivätty oikein. Päivämäärät on ilmaistava RFC 3339- tai RFC 822 -päivämäärämuodoissa.

Esimerkkejä kelvollisen päivämäärän muotoilusta:

wed, 04 Oct 2017 15:00:00 +0200
2017-10-04T13:00:00+00:00

Läpi napsautusnopeus (CTR)

Napsautusnopeus (CTR) – napsautusten määrä jaettuna näyttökertojen määrällä – on yksi sisällön luokittelun määrittämiseen käytetyn osallistumisen mittari. CTR:hen vaikuttavat pääasiassa sisällön elementit, jotka näkyvät linkkiä edistettäessä, mukaan lukien otsikko/otsikko, kuva ja abstrakti. Koneoppiminen arvioi kunkin sisällön CTR-potentiaalin.

Sisältö, jossa on korkea CTR, on yleensä hyvä, vaikka on myös sisältöluokka, jolla voi olla korkea CTR, mutta joka myös aiheuttaa tyytymättömyyttä lukijoilta - clickbait. Lisätietoja tästä on negatiivisia signaaleja käsittelevässä osiossamme.

Tuoreus ja ajantasaisuus

Uutissyötteen sisällön odotetaan olevan "tuoretta" ja oikea-aikaista. Tämän seurauksena uudempi sisältö sijoittuu keskimäärin vanhempaa sisältöä korkeammalle. Uutis-, talous- tai urheilutarinoiden uusimmat uutiset ovat tärkeitä, koska näillä vertikaalilla on yleensä tarinoita, jotka ikääntyvät nopeasti. Algoritmit tunnistavat, että muut aiheet ovat yleensä ikivihreämpiä ja sallivat tämän sisällön olla vanhempaa, tunnistaen sen. Sisältö, jolla on virheelliset julkaistut päivämäärät, voi olla alempana.

Trendit ja uutiskelpoisuus

Suosituista aiheista, tuoreista uutisista ja uutisotsikoista kertovia tarinoita arvostetaan keskimäärin enemmän. Syötteen ylimmät sijainnit on usein varattu päivän johtaville uutisille.

Suuntauksia havaitaan seuraamalla useita ulkoisia tietolähteitä, sekä julkisia että omistusoikeudellisia. Järjestelmä valvoo, mikä on suosittua Internetissä yleisesti sekä mikä on suosittua Microsoftin piirtoalustalla ja Bing-haulla. Nämä signaalit yhdistetään ja lasketaan keskiarvon perusteella, jotta jokainen sisältökohde arvioisi sen potentiaalia olla suosittu. Kohteet, joilla on enemmän potentiaalia, on luokiteltu syötteeseen korkeammalle.

Brändin viranomainen

Tunnettujen kansallisten tai maailmanlaajuisten uutiskustantajien tarinoilla on suurempi painoarvo, koska kuluttajat ja kustantajat pitävät niitä arvovaltaisempina ja luotetumpina. Paikallisten tai vähemmän tunnettujen tuotemerkkien tarinat ovat kuitenkin myös tärkeitä mukautettujen syötteiden osia, ja ne luokitellaan usein korkealle muiden signaalien vuoksi.

Algoritmit eivät vielä pidä auktoriteettia aiheittain: esimerkiksi jotkut julkaisijat ovat arvovaltaisempia urheilun alalla, kun taas toiset ovat erikoistuneet politiikkaan. Tämä on alue, jota Microsoft odottaa parantavansa tulevissa ranking-päivityksissä.

Negatiiviset signaalit ja clickbait

Osa sisällöstä luo napsautuksia, mutta aiheuttaa myös tyytymättömyyttä käyttäjiltä, jotka pitävät otsikkoa harhaanjohtavana (ei toimita luvattua sisältöä) tai huonolaatuista tarinaa. Esimerkkejä ovat otsikot, jotka ovat harhaanjohtavia, liioittelevat tarinaa tai ovat liian järkyttäviä tai emotionaalisia. Yleisesti tunnettu clickbait, tämä sisältö voi olla alempana käyttäjän käyttäytymisen perusteella, mikä viittaa tyytymättömyyteen toimintojen, kuten korkean pompun, kautta.

Tiettyjä malleja ovat esimerkiksi seuraavat:

Otsikko, joka ylittää kiusankappaleen, erityisesti adverbin "tämä" liikakäytöllä (esim. Älä koskaan juo tätä lentokoneessa).
Otsikko, joka esittää tarinan sisällön ja/tai tuonnin väärin, jolloin se ei vastaa lukijan odotuksia. Rikottu lupaus voi vaihdella resurssin (kuten otsikossa viitatun videon) poisjättämisestä tai tärkeiden tietojen puuttumisesta.

Sisältö, joka voi aiheuttaa epämukavuutta

Osana jatkuvia pyrkimyksiämme parantaa sisällön laatua ja säilyttää positiivinen kokemus kaikille käyttäjille MSN soveltaa tiukempia standardeja sisältöön, jota voidaan pitää loukkaavana, graafisena tai sopimattomana. Julkaisut voidaan poistaa tai poistaa, jos otsikoissa, kuvissa tai leipätekstissä on häiritsevää tai kutkuttavaa materiaalia, jolla ei ole laajempaa toimituksellista tai yhteiskunnallista merkitystä.

Esimerkkejä sisällöstä, joka voi laukaista nämä signaalit, ovat seuraavat:

Yksityiskohtaiset kuvaukset kehon funktioista (esim. ilmavaus, uloste, virtsaaminen, näppylän ponnahdus)
Sukupuolitauteja
Rivoja kohtaamisia (esimerkiksi tapaamisia seksityöntekijöiden kanssa, julkista seksiä, julkista alastomuutta), joissa ei ole laajempaa yhteiskunnallista merkitystä, kuten poliittista skandaalia.
Rikostarinat, jotka sisältävät liiallisia yksityiskohtia (esimerkiksi seksuaalisen teon tai hirvittävän murhan yksityiskohdat), jotka ylittävät paljaat tosiasiat
Titillating tai aikuisteemaiset tarinat (esim. eksplisiittiset seksuaaliset neuvot) eivät sovi yleisille yleisöille
Sisältö, joka viittaa seksuaaliseen poikkeamiseen ja bestialiteettiin
Eläinten seksuaalinen käyttäytyminen
Graafinen hajoaminen (esim. toukkien saastuttama liha)

Tällainen sisältö voi vähentää lukijan luottamusta, ja se merkitään usein sopimattomaksi laajalle jakelulle.

Vakavuusasteen mukaan seuraavalla sisällöllä voi olla rajallinen altistuminen tai se voidaan poistaa vastaavasti, mikä johtaa artikkelitason vaikutuksen vähenemiseen:

Julkkisjuorut: Rajoitamme nyt julkkissisällön altistumista keskittymällä (mutta ei rajoittuen) julkkistaisteluihin, seksualisoimalla sitä, mitä julkkiksilla on päällään, vaatekaapin toimintahäiriöt, päivittäiset julkkistoiminnot, suhdeongelmat jne. Tämä sisältö näkyy edelleen MSN-sivuilla, mutta se näkyy vain käyttäjille, jotka etsivät tällaista sisältöä.

Kuinka MSN arvioi sisältöä

Artikkelin sisältö

Käyttäjän osuvuus

Muotoilu

Muotoilemattoman tekstin pitkät lohkot

Alkuperäiset artikkelilinkit

Tekstimuotoinen URL-osoite

Kelvollinen päivämäärämuoto

Läpi napsautusnopeus (CTR)

Tuoreus ja ajantasaisuus

Trendit ja uutiskelpoisuus

Brändin viranomainen

Negatiiviset signaalit ja clickbait

Sisältö, joka voi aiheuttaa epämukavuutta

Oliko näistä tiedoista hyötyä?

Kiitos palautteesta!