Ako služba MSN hodnotí obsah

MSN publikuje správy, fotogalérie a videá od tisícov vydavateľov na celom svete a propaguje tento obsah v rámci produktov spoločnosti Microsoft vrátane prehliadačov Microsoft Edge, Microsoft Windows, MSN.com a mobilnej aplikácie MSN.

Vždy, keď používateľ zobrazí informačný kanál MSN, obnoví sa s najnovším prispôsobeným obsahom. Na základe rôznych signálov algoritmy vyberú a zoradia obsah v informačnom kanáli s redakčným dohľadom. Tento systém vytvorenia poradia obsahu je navrhnutý tak, aby sa zapojil a informoval, vyberal príbehy, ktoré sú pre každú osobu najrelevantnejšie, a zároveň zabezpečil, že obsah je včasný, novinový, vysokokvalitný a bezpečný pre prácu a domácnosť.

Relatívna dôležitosť týchto parametrov sa môže líšiť pri každom zobrazení informačného kanála s aktualizáciami používateľom. Algoritmy sa vždy vyvíjajú, pretože neustále identifikujeme a vylepšujeme signály a experimentujeme s novými funkciami.

Obsah tohto článku

Relevantnosť používateľa

Formátovanie

Miera prekliknutia (CTR)

Čerstvosť a aktuálnosť

Trendy a novinky

Autorita značky

Negatívne signály a clickbait

Relevantnosť používateľa

Spoločnosť Microsoft poskytuje každému spotrebiteľovi prispôsobený informačný kanál s aktualizáciami na splnenie jedinečných záujmov a preferencií jednotlivých osôb pre obsah. Jadrom tohto prispôsobenia sú algoritmy, ktoré zodpovedajú používateľským preferenciám s porozumením dokumentu. Tieto algoritmy sú navrhnuté tak, aby pre každého používateľa vybrali najrelevantnejší obsah.

Predvoľby používateľa sa systém časom učí prostredníctvom dvoch prístupov:

  • Explicitné prispôsobenie. Algoritmus rešpektuje spôsob, akým používatelia manuálne nakonfigurujú svoje nastavenia, vrátane akcií, ako sú napríklad sledovanie určitých tém, páči sa mi to alebo nepáči konkrétny obsah alebo indikuje preferenciu vydavateľa.
  • Implicitné prispôsobenie. V súlade s nastaveniami ochrany osobných údajov používateľa, keď osoba číta obsah a zaoberá sa produktmi spoločnosti Microsoft, príbehy sa analyzujú na účely lepšieho pochopenia preferencií používateľa. Algoritmy vyhľadávajú dlhodobé aj krátkodobé vzory pre každého používateľa, pričom uznávajú, že záujmy obsahu sa môžu v krátkodobom horizonte líšiť, pričom vykazujú rôzne dlhodobé tendencie. (Ďalšie informácie o ochrane osobných údajov spoločnosti Microsoft nájdete tu).

Algoritmy strojového učenia sú základom podrobného pochopenia dokumentov, a to okrem jednoduchého rozpoznávania "tém": Systém vykonáva analýzu každého dokumentu, aby získal prehľady na základe textu a metaúdajov a skonvertuje obsah na matematický model.

Dva matematické modely – používateľské preferencie a pochopenie dokumentu – možno porovnať s výberom obsahu, ktorý je pre každú osobu najbližšie.

Okrem toho, že sa obsah priamo zhoduje s každým používateľom, algoritmy vyhľadávajú aj obsah, ktorý zapája používateľov s podobnými preferenciami.

Formátovanie

Chceme propagovať kvalitný obsah v informačnom kanáli, ktorý neobsahuje žiadne vizuálne chyby, ako sú chýbajúce prvky hlavičky, chýbajúce zoznamy, chýbajúce URL adresy alebo irelevantné slová/frázy, ktoré majú za následok nedostatočné používateľské prostredie. Ak sa chcete vyhnúť tomu, aby sa vášmu obsahu zobrazovala obmedzená expozícia, postupujte podľa pokynov na publikovanie vrátane týchto:

Dlhé bloky neformátovaného textu

Obsah, ktorý je vysokokvalitný a bez chybných položiek, ako je napríklad neformátovaný text, má vyššiu pravdepodobnosť viditeľnosti v informačnom kanáli. Pri nahrávaní sa uistite, že obsahuje správnu vetu a štruktúru odseku a kódovanie. Články bez zlomov riadkov alebo zlomov odsekov sa v informačnom kanáli nebudú propagovať.

Príklad formátovaného textu: <p>Toto je odsek.</p> (Všimnite si otvárací a záverečný kód).

Prepojenia pôvodného článku

Prepojenia späť na pôvodný článok sa môžu zobraziť len v dolnej časti článku. Príspevky, ktoré prepájajú späť na originál v hlavnom tele textu, budú mať obmedzený dosah.

URL adresa obyčajného textu

Ak máte v obsahu prepojenia, musíte sa uistiť, že sú správne formátované. Ak napríklad prepojenia vo vašom obsahu vyzerajú takto: https://www.conotoso.com/r/linden-new-york obsah nie je správne naformátovaný a môže mať obmedzenú expozíciu alebo byť podľa toho odstránený.

Platný formát dátumu

Aby sme zabezpečili, že náš obsah je relevantný pre našich spotrebiteľov, musíme sa uistiť, že články, ktoré im ukážeme, sú presne datované. Dátumy musia byť vyjadrené pomocou formátu dátumu RFC 3339 alebo RFC 822.

Príklady platného formátu dátumu:

  • St, 4. okt 2017 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

Miera prekliknutia (CTR)

Miera prekliknutia (CTR) – počet kliknutí vydelený počtom zobrazení – je jednou mierou rezervovania použitou pri určovaní poradia obsahu. CTR je primárne ovplyvnené prvkami obsahu, ktoré sa zobrazujú pri propagovaní prepojenia, vrátane nadpisu/nadpisu, obrázka a abstraktu. Strojové učenie hodnotí možnosť CTR pre každú časť obsahu.

Obsah s vysokým CTR je vo všeobecnosti dobrý, aj keď existuje aj kategória obsahu, ktorý môže mať vysokú mp, ale tiež generuje nespokojnosť od čitateľov - clickbait. Ďalšie informácie nájdete nižšie v našej časti o negatívnych signáloch.

Čerstvosť a aktuálnosť

Očakáva sa, že obsah v informačnom kanáli správ bude aktuálny a aktuálny. V dôsledku toho sa novší obsah v priemere radí vyššie ako starší obsah. Najnovšie správy, financie alebo športové príbehy sú dôležité, pretože tieto vertikály majú tendenciu mať príbehy, ktoré starnú rýchlo. Algoritmy rozpoznať iné témy majú tendenciu byť viac evergreen a umožniť tento obsah, aby sa starší, uznávajúc, že. Obsah s nepresnými publikovanými dátumami sa môže zoradiť nižšie.

Príbehy o najpopulárnejších témach, novinkách a hlavných novinkách sú v priemere hodnotené vysoko. Najvyššie pozície v krmivách sú často vyhradené pre hlavné novinky dňa.

Trendy pozorujeme sledovaním viacerých externých zdrojov údajov, verejných aj majetkových. Systém monitoruje trendy na internete ako celok, ako aj to, čo je trendy na plátnach spoločnosti Microsoft a vyhľadávaní v Bingu. Tieto signály sa skombinujú a spájkujú tak, aby hodnotil každú položku obsahu podľa jej potenciálu byť trendová. Položky s väčším potenciálom sa v informačnom kanáli nachádzajú vyššie.

Autorita značky

Príbehy od známych národných alebo globálnych vydavateľov správ majú väčšiu váhu, pretože spotrebitelia aj vydavatelia ich vnímajú ako autoritatívnejšie a dôveryhodnejšie. Príbehy miestnych alebo menej známych značiek sú však tiež dôležitými súčasťami prispôsobených informačných kanálov a často sú vysoko hodnotené kvôli iným signálom.

Algoritmy ešte nepovažujú autoritu podľa témy: napríklad niektorí vydavatelia sú autoritatívnejší v oblasti športu, zatiaľ čo iní sa špecializujú na politiku. Toto je oblasť, s akou spoločnosť Microsoft očakáva zlepšenie v budúcich aktualizáciách poradia.

Negatívne signály a clickbait

Určitý obsah generuje kliknutia, ale tiež generuje nespokojnosť používateľov, ktorí vnímajú nadpis ako zavádzajúci (nedoručujú obsah, ktorý ste sľúbili) alebo príbeh nižšej kvality. Príkladom sú titulky, ktoré sú zavádzajúce, preháňajú príbeh, alebo sú príliš šokujúce alebo emocionálne. Tento obsah, ktorý je všeobecne známy ako clickbait, môže byť hodnotený nižšie na základe správania používateľa, čo naznačuje nespokojnosť prostredníctvom akcií, ako je napríklad vysoká miera odskoku.

Konkrétne vzory zahŕňajú:

  • Titulok, ktorý presahuje teaser, a to najmä s nadužívaniu príslovky "to" (napr. Nikdy piť to v lietadle).
  • Nadpis, ktorý skresľuje obsah skutočného príbehu a/alebo import, čím nespĺňa očakávania čitateľa. Nefunkčný sľub môže pochádzať z vynechania majetku (napríklad videa, na ktoré sa odkazuje v titulku), alebo sa vôbec nemusí zaoberať kľúčovými informáciami.

Obsah, ktorý môže spôsobiť nepohodlie

V rámci nášho neustáleho úsilia o zlepšenie kvality obsahu a udržanie pozitívnych skúseností pre všetkých používateľov uplatňuje MSN prísnejšie normy na obsah, ktorý sa môže považovať za urážlivý, grafický alebo nevhodný. Príspevky môžu byť deprioritized alebo odstránené, ak titulky, obrázky alebo základný text zahŕňajú znepokojujúce alebo tiillating materiál, ktorý nemá širší redakčný alebo spoločenský význam.

Medzi príklady obsahu, ktorý môže vyvolať tieto signály, patria:

  • Podrobné zobrazenie telesných funkcií (napr. nadúvanie, exkrementy, močenie, pupienok)
  • Pohlavne prenosné choroby
  • Nemravné stretnutia (napr. stretnutia so sexuálnymi pracovníčkymi, verejný sex, verejná nahota), kde neexistuje širší spoločenský význam, ako je politický škandál.
  • Zločin príbehy, ktoré zahŕňajú nadmerné detaily (napríklad špecifiká sexuálneho aktu alebo hrozné vraždy), ktoré idú nad rámec holé fakty
  • Titillujúce alebo príbehy s motívom pre dospelých (napr. explicitné sexuálne poradenstvo) nie sú vhodné pre všeobecné publikum
  • Obsah odkazujúci na sexuálnu deviance a smiešnosť
  • Sexuálne správanie zvierat
  • Grafický rozklad (napr. mäso zamorené červami)

Tento typ obsahu môže znížiť dôveryhodnosť čitateľa a často je označený ako nevhodný pre širokú distribúciu.

V závislosti od závažnosti môže byť nasledujúci obsah primerane obmedzený alebo odstránený, čo vedie k zníženiu počtu zobrazení na úrovni článku:

  • Celebrity klebety: Sme teraz obmedzuje expozíciu celebrity obsah so zameraním na (ale nielen) celebrity bojuje, sexualizovať to, čo celebrity nosia, skriňa poruchy, každodenné celebrity činnosti, vzťah otázky, atď Tento obsah sa bude naďalej zobrazovať na stránkach MSN, ale bude sa zobrazovať len používateľom, ktorí hľadajú tento typ obsahu.