Come MSN classifica i contenuti
MSN pubblica notizie, gallerie fotografiche e video di migliaia di editori a livello globale e promuove questi contenuti in tutti i prodotti Microsoft, tra cui Microsoft Edge, Microsoft Windows, MSN.com e l'app per dispositivi mobili MSN.
Ogni volta che un consumatore visualizza il feed MSN, si aggiorna con i contenuti personalizzati più recenti. Sulla base di vari segnali, algoritmi selezionano e ordinano il contenuto nel feed con supervisione editoriale. Questo sistema di classificazione dei contenuti è progettato per coinvolgere e informare, scegliendo storie che sono le più rilevanti per ogni persona, garantendo al contempo che il contenuto sia tempestivo, degno di notizie, di alta qualità e sicuro per il lavoro e la casa.
L'importanza relativa di questi parametri può variare ogni volta che un newsfeed viene visualizzato da un utente. Gli algoritmi sono in continua evoluzione, perché identifichiamo e miglioriamo continuamente i segnali e sperimentiamo nuove funzionalità.
Contenuto dell'articolo
Pertinenza degli utenti
Microsoft offre a tutti i consumatori un newsfeed personalizzato per soddisfare il set unico di interessi e preferenze di ogni persona per il contenuto. Alla base di questa personalizzazione ci sono algoritmi che corrispondono alle preferenze dell'utente con la comprensione del documento. Questi algoritmi sono progettati per selezionare il contenuto più pertinente per ogni utente.
Le preferenze di un utente vengono apprese nel tempo dal sistema attraverso due approcci:
- Personalizzazione esplicita. L'algoritmo rispetta il modo in cui gli utenti configurano manualmente le impostazioni, incluse azioni come seguire determinati argomenti, esprimere apprezzamento o non gradire contenuti specifici o indicare una preferenza dell'autore.
- Personalizzazione implicita. In conformità con le impostazioni di privacy di un utente, quando una persona legge il contenuto e interagisce con i prodotti Microsoft, le storie vengono analizzate per individuare modelli per comprendere meglio le preferenze dell'utente. Gli algoritmi cercano modelli a lungo termine e a breve termine per ogni utente, riconoscendo che gli interessi dei contenuti possono variare a breve termine, pur mostrando diverse tendenze a lungo termine. Altre informazioni sulla privacy di Microsoft sono disponibili qui.
Gli algoritmi di apprendimento automatico guidano la comprensione approfondita dei documenti oltre a riconoscere semplicemente gli "argomenti": il sistema esegue analisi su ogni documento per ottenere informazioni basate su testo e metadati e converte il contenuto in un modello matematico.
È possibile confrontare i due modelli matematici, ovvero le preferenze utente e la comprensione dei documenti, per selezionare il contenuto più simile per ogni persona.
Oltre ad associare direttamente contenuto a ogni utente, gli algoritmi cercano anche contenuti che coinvolgino gli utenti con preferenze simili.
Formattazione
Vogliamo promuovere il contenuto di qualità nel nostro feed che non presenta difetti visivi come elementi di intestazione mancanti, listicoli mancanti, URL mancanti o parole/frasi irrilevanti che si tradurrà in una scarsa esperienza utente. Per evitare che il contenuto venga esposto a un'esposizione limitata, assicurarsi di seguire le linee guida per la pubblicazione, tra cui:
Lunghi blocchi di testo non formattato
Il contenuto di alta qualità e privo di difetti, ad esempio testo non formattato, ha maggiori probabilità di ottenere visibilità nel feed. Assicurarsi che abbia la struttura corretta per la frase e il paragrafo e la codifica al momento del caricamento. Gli articoli senza interruzioni di riga o di paragrafo non verranno alzati di livello nel feed.
Esempio di testo formattato: <p>Si tratta di un paragrafo.</p> (Prendi nota del codice di apertura e di chiusura).
Collegamenti all'articolo originale
I collegamenti all'articolo originale possono essere visualizzati solo in fondo all'articolo. I post che si collegano all'originale all'interno del corpo principale del testo avranno una portata limitata.
URL testo normale
Se il contenuto contiene collegamenti, è necessario assicurarsi che siano formattati in modo appropriato. Ad esempio, se i collegamenti nel contenuto hanno un aspetto simile al seguente: https://www.conotoso.com/r/linden-new-york il contenuto non è formattato correttamente e potrebbe presentare un'esposizione limitata o essere rimosso di conseguenza.
Formato di data valido
Per garantire che i nostri contenuti siano pertinenti per i nostri consumatori, dobbiamo assicurarci che gli articoli che mostriamo siano accuratamente datati. Le date devono essere espresse in formato di data RFC 3339 o RFC 822.
Esempi di formati di data validi:
- Wed, 04 Oct 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Tasso di clickthrough (CTR)
La percentuale di clic (CTR, Click-through Rate), ovvero il numero di clic divisi per il numero di impression, è una misura di impegno usata per determinare la classificazione del contenuto. Il CTR è influenzato principalmente dagli elementi del contenuto visualizzati durante la promozione del collegamento, tra cui titolo/titolo, immagine e forma astratta. L'apprendimento automatico giudica il potenziale CTR per ogni singolo contenuto.
Il contenuto con CTR elevato è generalmente buono, anche se c'è anche una categoria di contenuto che può avere CTR elevato, ma genera anche insoddisfazione da parte dei lettori - clickbait. Per altre informazioni, vedere la sezione Segnali negativi di seguito.
Freschezza e tempestività
Il contenuto di un newsfeed dovrebbe essere "fresco" e tempestivo. Di conseguenza, il contenuto più recente è in media superiore al contenuto precedente. Le ultime notizie, finanza o storie sportive sono importanti perché questi verticali tendono ad avere storie che invecchiano rapidamente. Gli algoritmi riconoscono che altri argomenti tendono ad essere sempre più sempreverdi e consentono a questo contenuto di essere meno recente, riconoscendo che. Il contenuto con date pubblicate imprecise può essere classificato in basso.
Tendenze e novità
In media, le storie su argomenti di tendenza, ultime notizie e notizie del titolo sono classificati più altamente. Le posizioni principali nel feed sono spesso riservate per le notizie importanti della giornata.
Le tendenze sono osservate monitorando più origini dati esterne, sia pubbliche che proprietarie. Il sistema monitora ciò che è di tendenza su Internet in generale, così come ciò che è di tendenza sulle aree di disegno Microsoft e ricerca di Bing. Questi segnali vengono combinati e calcolati in media per valutare ogni elemento di contenuto in base al potenziale di tendenza. Gli elementi con un potenziale maggiore vengono classificati più in alto nel feed.
Autorità del marchio
Le storie di noti editori di notizie nazionali o globali hanno un peso maggiore, perché sia i consumatori che gli editori li considerano più autorevoli e attendibili. Tuttavia, le storie di marchi locali o meno noti sono anche componenti importanti di feed personalizzati e sono spesso classificati altamente a causa di altri segnali.
Gli algoritmi non considerano ancora l'autorità per argomento: ad esempio, alcuni editori sono più autorevoli nel settore dello sport, mentre altri si specializzano in politica. Si tratta di un'area che Microsoft prevede di migliorare nei futuri aggiornamenti della classificazione.
Segnali negativi e clickbait
Alcuni contenuti generano clic, ma genera anche insoddisfazione da parte degli utenti che percepiscono un titolo fuorviante (non fornire il contenuto promesso) o la storia di qualità inferiore. Gli esempi includono titoli fuorvianti, esagerati o eccessivamente scioccanti o emotivi. Noto come clickbait, questo contenuto può essere classificato più in basso in base al comportamento dell'utente che suggerisce insoddisfazione attraverso azioni come la frequenza di rimbalzo elevata.
Modelli specifici includono:
- Un titolo che va oltre un teaser, soprattutto con l'uso eccessivo dell'avverbio "questo" (ad esempio, Non bere mai questo su un aereo).
- Un titolo che rappresenta in modo errato il contenuto della storia e/o l'importazione, senza soddisfare le aspettative del lettore. Una promessa interrotta può variare dal omettere una risorsa, ad esempio un video a cui si fa riferimento nel titolo, o non indirizzare affatto le informazioni chiave.
Contenuto che può causare disagio
Nell'ambito dei nostri sforzi continui per migliorare la qualità dei contenuti e mantenere un'esperienza positiva per tutti gli utenti, MSN applica standard più rigidi ai contenuti che possono essere percepiti come offensivi, grafici o inappropriati. I post possono essere deprioritizzati o rimossi se i titoli, le immagini o il corpo del testo includono materiale inquietante o titillante che manca di una rilevanza editoriale o sociale più ampia.
Esempi di contenuti che possono attivare questi segnali includono:
- Raffigurazioni dettagliate di funzioni corporee (ad esempio flatulenza, escrementi, minzione, papponi che spuntano)
- Malattie sessualmente trasmesse
- Incontri di Lewd (ad esempio incontri con lavoratori sessuali, sesso pubblico, nudità pubblica) in cui non vi è una rilevanza sociale più ampia, ad esempio uno scandalo politico.
- Storie di crimine che includono un dettaglio eccessivo (ad esempio, le specifiche di un atto sessuale o un omicidio raccapricciante) che vanno oltre i fatti nudi
- Storie a tema titillante o a tema adulto (ad esempio, consigli sessuali espliciti) non appropriate per il pubblico generale
- Contenuto che fa riferimento a devianza e somiglianza sessuale
- Comportamento sessuale degli animali
- Decomposizione grafica (ad esempio carne infestata da vermi)
Questo tipo di contenuto può ridurre l'attendibilità del lettore ed è spesso contrassegnato come inappropriato per un'ampia distribuzione.
A seconda della gravità, l'esposizione limitata o la rimozione del contenuto seguente può comportare una riduzione dell'impressione a livello di articolo:
- Pettegolezzi sulle celebrità: stiamo limitando l'esposizione dei contenuti delle celebrità incentrati su (ma non limitati a) combattimenti tra celebrità, sessualizzando ciò che le celebrità indossano, malfunzionamenti del guardaroba, attività quotidiane di celebrità, problemi di relazione, ecc. Questo contenuto verrà comunque visualizzato nelle pagine MSN, tuttavia, verrà esposto solo agli utenti che cercano questo tipo di contenuto.