Cum clasifică MSN conținutul

MSN publică știri, galerii foto și videoclipuri de la mii de editori la nivel global și promovează acest conținut în toate produsele Microsoft, inclusiv Microsoft Edge, Microsoft Windows, MSN.com și aplicația mobilă MSN.

De fiecare dată când un consumator vizualizează fluxul MSN, acesta se reîmprospătează cu cel mai recent conținut personalizat. Pe baza diverselor semnale, algoritmii selectează și ordonează conținutul din flux cu supraveghere editorială. Acest sistem de conținut de ierarhizare este proiectat să se implice și să informeze, alegând articole care sunt cele mai relevante pentru fiecare persoană, asigurând în același timp conținutul la timp, demn de știri, de înaltă calitate și sigur pentru locul de muncă și acasă.

Importanța relativă a acestor parametri poate varia de fiecare dată când un flux de știri este vizualizat de un utilizator. Algoritmii evoluează întotdeauna pe măsură ce identificăm și îmbunătățim continuu semnalele și experimentăm cu noi caracteristici.

În acest articol

Relevanța utilizatorului

Formatare

Rată de transfer (CTR)

Prospețime și actualitate

Tendințe și știri demne de știri

Autoritatea de branding

Semnale negative și clicbait

Relevanța utilizatorului

Microsoft oferă fiecărui consumator un flux de știri personalizat pentru a satisface setul unic de interese și preferințe pentru conținut al fiecărei persoane. În centrul acestei personalizări se află algoritmii care corespund preferințelor utilizatorului cu înțelegerea documentelor. Acești algoritmi sunt proiectați pentru a selecta cel mai relevant conținut pentru fiecare utilizator.

Preferințele unui utilizator sunt învățate în timp de către sistem prin două abordări:

  • Personalizare explicită. Algoritmul respectă modul în care utilizatorii își configurează manual setările, inclusiv acțiuni cum ar fi urmărirea anumitor subiecte, aprecierea sau dezagrearea conținutului specific sau indicarea unei preferințe de editor.
  • Personalizare implicită. În conformitate cu setările de confidențialitate ale unui utilizator, în timp ce o persoană citește conținutul și se implică în produsele Microsoft, articolele sunt analizate pentru modele, pentru a înțelege mai bine preferințele utilizatorului. Algoritmii caută modele pe termen lung și pe termen scurt pentru fiecare utilizator, recunoscând că interesele de conținut pot varia pe termen scurt, în timp ce prezintă tendințe diferite pe termen lung. (Citiți mai multe despre Confidențialitatea Microsoft aici).

Algoritmii de învățare programată determină înțelegerea profundă a documentelor dincolo de recunoașterea simplă a "subiectelor": Sistemul efectuează analize pe fiecare document pentru a obține detalii bazate pe text și metadate și efectuează conversia conținutului într-un model matematic.

Cele două modele matematice - preferințele utilizatorului și înțelegerea documentelor - pot fi comparate pentru a selecta conținut care este cea mai apropiată potrivire pentru fiecare persoană.

Pe lângă potrivirea directă a conținutului cu fiecare utilizator, algoritmii caută și conținut care îi atrage pe utilizatori cu preferințe similare.

Formatare

Dorim să promovăm conținutul de calitate din fluxul nostru care nu are defecte vizuale, cum ar fi elemente de antet lipsă, listicle lipsă, URL-uri lipsă sau cuvinte/expresii irelevante care duc la o experiență slabă a utilizatorului. Pentru a evita expunerea limitată a conținutului, asigurați-vă că urmați instrucțiunile de publicare, inclusiv următoarele:

Blocuri lungi de text neformatat

Conținutul de înaltă calitate și fără defecte, cum ar fi textul neformatat, are o probabilitate mai mare de a obține vizibilitate în flux. Asigurați-vă că are structura corespunzătoare a propozițiilor și paragrafului și codificarea atunci când o încărcați. Articolele fără sfârșituri de linie sau sfârșituri de paragraf nu vor fi promovate în flux.

Exemplu de text formatat: <p>Acesta este un paragraf.</p> (Rețineți codul de deschidere și de închidere).

Linkuri articol original

Linkurile înapoi la articolul original pot apărea doar în partea de jos a articolului. Publicările care fac legătura înapoi la original în corpul principal al textului vor avea o acoperire limitată.

URL text simplu

Dacă aveți linkuri în conținut, trebuie să vă asigurați că acestea sunt formatate corespunzător. De exemplu, dacă linkurile din conținut arată astfel: https://www.conotoso.com/r/linden-new-york atunci conținutul nu este formatat corect și poate avea expunere limitată sau poate fi eliminat în consecință.

Format de dată valid

Pentru a ne asigura că conținutul nostru este relevant pentru consumatorii noștri, trebuie să ne asigurăm că articolele pe care le arătăm sunt datate corect. Datele calendaristice trebuie exprimate utilizând formate de dată RFC 3339 sau RFC 822.

Exemple de format de dată valid:

  • Wed, 04 octombrie 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Rată de transfer (CTR)

Rata de clic (CTR) - numărul de clicuri împărțite la numărul de afișări - este o măsură a angajamentului utilizată pentru determinarea clasificării conținutului. CTR este influențat în principal de elementele conținutului care sunt afișate atunci când promovați linkul, inclusiv titlul/titlul, imaginea și rezumatul. Învățarea programată judecă potențialul CTR pentru fiecare fragment de conținut.

Conținutul cu CTR înalt este în general bun, deși există, de asemenea, o categorie de conținut care poate avea un CTR mare, dar generează, de asemenea, nemulțumirea din partea cititorilor - clickbait. Vedeți mai multe despre aceasta mai jos în secțiunea noastră despre Semnale negative.

Prospețime și actualitate

Conținutul dintr-un flux de știri este de așteptat să fie "proaspăt" și oportun. În consecință, conținutul mai nou este, în medie, mai mare decât conținutul mai vechi. Cele mai recente știri, finanțe sau povești sportive sunt importante, deoarece aceste verticale tind să aibă povești care îmbătrânesc rapid. Algoritmii recunosc alte subiecte care tind să fie pe tot mai mare și permit ca acest conținut să fie mai vechi, recunoscând acest lucru. Conținutul cu date publicate incorecte poate fi ierarhizat mai jos.

În medie, articolele despre subiectele populare, știrile de ultimă oră și știrile despre titluri sunt clasificate mai mult. Pozițiile de top din flux sunt rezervate adesea pentru știrile importante ale zilei.

Tendințele sunt observate prin monitorizarea mai multor surse de date externe, atât publice, cât și private. Sistemul monitorizează ce este în tendințe pe internet în general, precum și ce este în tendințe pe pânzele Microsoft și în căutarea Bing. Aceste semnale sunt combinate și medii pentru a evalua fiecare element de conținut în funcție de potențialul său de tendință. Elementele cu mai mult potențial sunt clasificate mai sus în flux.

Autoritatea de branding

Povești de la bine-cunoscute la nivel național sau global de știri au o greutate mai mare, deoarece consumatorii și editorii deopotrivă le vizualiza ca fiind mai autoritar și de încredere. Cu toate acestea, poveștile de la branduri locale sau mai puțin cunoscute sunt, de asemenea, componente importante ale fluxurilor personalizate și sunt adesea clasificate foarte datorită altor semnale.

Algoritmii nu consideră încă autoritatea după subiect: de exemplu, unii editori sunt mai autoritari în domeniul sportului, în timp ce alții sunt specializați în politică. Aceasta este o zonă pe care Microsoft se așteaptă să o îmbunătățească în viitoarele actualizări de ierarhizare.

Semnale negative și clicbait

Unele tipuri de conținut generează clicuri, dar generează, de asemenea, nemulțumirea utilizatorilor care percep un titlu ca fiind înșelător (nu livrând conținutul promis de titlu) sau povestea de o calitate inferioară. Printre exemple se numără titluri care induc în eroare, exagerează povestea sau sunt extrem de șocante sau emoționale. Cunoscut ca clickbait, acest conținut poate fi clasificat mai jos pe baza comportamentului utilizatorului, care sugerează nemulțumire prin acțiuni cum ar fi rata de săritură mare.

Modelele specifice includ:

  • Un titlu care merge dincolo de un teaser, mai ales cu overuse de adverb "this" (de exemplu, Nu bea asta pe un avion).
  • Un titlu care returnează greșit conținutul real al poveștii și/sau importul, nereușind astfel să răspundă așteptărilor cititorului. O promisiune întreruptă poate varia de la omiterea unui activ (cum ar fi un videoclip menționat în titlu) sau neabordarea deloc a informațiilor cheie.

Conținut care poate cauza disconfort

Ca parte a eforturilor noastre continue de a îmbunătăți calitatea conținutului și de a menține o experiență pozitivă pentru toți utilizatorii, MSN aplică standarde mai stricte conținutului care poate fi perceput ca ofensator, grafic sau inadecvat. Postările pot fi deprioritizate sau eliminate dacă titlurile, imaginile sau corpul de text includ materiale deranjante sau titilante care nu au relevanță editorială sau societală mai largă.

Printre exemplele de conținut care pot declanșa aceste semnale se numără:

  • Descrieri detaliate ale funcțiilor corporale (de exemplu, flatulență, excrement, urinare, popping)
  • Boli cu transmitere sexuală
  • Lewd întâlnește (de exemplu, întâlniri cu lucrătorii sexuali, sex public, nuditate publică) în care nu există relevanță societală mai largă, cum ar fi un scandal politic.
  • Crime povești care includ detalii excesive (de exemplu, specificul unui act sexual sau o crimă înspăimântătoare), care merge dincolo de faptele de bare
  • Povestiri titilante sau cu tematică adultă (de exemplu, consiliere sexuală explicită) care nu sunt adecvate pentru publicul general
  • Conținut care face referire la deviația sexuală și bestialitatea
  • Comportamentul sexual al animalelor
  • Descompunere grafică (de exemplu, carne infestată cu larve)

Acest tip de conținut poate reduce încrederea cititorului și este marcat adesea ca inadecvat pentru o distribuire largă.

În funcție de severitate, următorul conținut poate avea expunere limitată sau eliminat în consecință, conducând la o scădere a afișării la nivel de articol:

  • Celebritate bârfă: Suntem acum limitarea expunerea de conținut celebritate concentrându-se pe (dar nu se limitează la) lupta celebritate, sexualizarea ceea ce celebrități sunt purta, defecțiuni dulap, zi de zi celebritate activități, probleme de relație, etc Totuși, acest conținut va apărea în continuare pe paginile MSN, dar va fi expus doar utilizatorilor care caută acest tip de conținut.