Jak witryna MSN pozycjonuje zawartość
WITRYNA MSN publikuje wiadomości, galerie zdjęć i klipy wideo od tysięcy wydawców na całym świecie oraz promuje tę zawartość w różnych produktach firmy Microsoft, takich jak Microsoft Edge, Microsoft Windows, MSN.com i aplikacja mobilna MSN.
Za każdym razem, gdy użytkownik przegląda kanał informacyjny MSN, odświeża się przy użyciu najnowszej spersonalizowanej zawartości. Na podstawie różnych sygnałów algorytmy wybierają i porządkują zawartość w kanale z nadzorem redakcyjnym. Ten system zawartości rankingowej ma na celu angażowanie i informowanie, wybieranie historii, które są najbardziej istotne dla każdej osoby, a jednocześnie zapewnienie, że zawartość jest terminowa, warta opublikowania, wysokiej jakości i bezpieczna do pracy i domu.
Względna ważność tych parametrów może się różnić przy każdym wyświetlaniu kanału informacyjnego przez użytkownika. Algorytmy stale ewoluują, ponieważ stale identyfikujemy i ulepszamy sygnały oraz eksperymentujemy z nowymi funkcjami.
W tym artykule
Istotność użytkownika
Firma Microsoft zapewnia każdemu konsumentowi spersonalizowany kanał informacyjny, aby spełnić unikatowy zestaw zainteresowań i preferencji poszczególnych osób dotyczących zawartości. Sednem tej personalizacji są algorytmy, które pasują do preferencji użytkownika ze zrozumieniem dokumentu. Te algorytmy są zaprojektowane tak, aby wybierać najbardziej istotną zawartość dla każdego użytkownika.
Preferencje użytkownika są w miarę upływu czasu poznane przez system za pomocą dwóch metod:
- Jawna personalizacja. Algorytm uwzględnia sposób ręcznego konfigurowania ustawień przez użytkowników, w tym czynności, takie jak obserwowanie określonych tematów, polubienie lub nielubienie określonej zawartości albo wskazanie preferencji wydawcy.
- Niejawna personalizacja. Zgodnie z ustawieniami prywatności użytkownika, gdy osoba czyta zawartość i angażuje się w produkty firmy Microsoft, historie są analizowane pod kątem wzorców, aby lepiej zrozumieć preferencje użytkownika. Algorytmy szukają zarówno długoterminowych, jak i krótkoterminowych wzorców dla każdego użytkownika, uznając, że zainteresowania zawartością mogą się różnić w krótkim okresie, wykazując jednocześnie różne tendencje długoterminowe. (Dowiedz się więcej o ochronie prywatności w firmie Microsoft tutaj).
Algorytmy uczenia maszynowego prowadzą do głębokiego zrozumienia dokumentów poza zwykłe rozpoznawanie "tematów": System przeprowadza analizy na każdym dokumencie, aby uzyskać szczegółowe informacje na podstawie tekstu i metadanych oraz konwertuje zawartość na model matematyczny.
Dwa modele matematyczne — preferencje użytkownika i opis dokumentu — można porównać z wybraną zawartością, która jest najbardziej zbliżona do każdej osoby.
Oprócz bezpośredniego dopasowywania zawartości do każdego użytkownika algorytmy wyszukują również zawartość, która angażuje użytkowników o podobnych preferencjach.
Formatowanie
Chcemy promować zawartość wysokiej jakości w naszym kanale informacyjnym, która nie zawiera żadnych wad wizualnych, takich jak brakujące elementy nagłówka, brakujące listy, brakujące adresy URL lub nieistotne wyrazy/frazy, które powodują słabe środowisko użytkownika. Aby uniknąć ograniczonej ekspozycji zawartości, upewnij się, że przestrzegasz wytycznych dotyczących publikowania, w tym następujących:
Długie bloki tekstu niesformatowanego
Zawartość wysokiej jakości i bez wad, takich jak tekst niesformatowany, ma większe prawdopodobieństwo uzyskania widoczności w kanale informacyjnym. Upewnij się, że ma właściwą strukturę zdań i akapitów oraz kodowanie podczas przekazywania. Artykuły bez podziałów wierszy i podziałów akapitów nie będą promowane w kanale informacyjnym.
Przykład tekstu sformatowanego: <p>To jest akapit.</p> (Zwróć uwagę na kod otwierający i zamykający).
Linki do oryginalnych artykułów
Linki z powrotem do oryginalnego artykułu mogą być wyświetlane tylko u dołu artykułu. Wpisy zawierające link do oryginału w głównej treści tekstu będą miały ograniczony zasięg.
Adres URL w postaci zwykłego tekstu
Jeśli w zawartości znajdują się linki, musisz upewnić się, że są one odpowiednio sformatowane. Jeśli na przykład linki w twojej zawartości wyglądają tak: https://www.conotoso.com/r/linden-new-york to zawartość nie jest poprawnie sformatowana i może mieć ograniczoną ekspozycję lub zostać odpowiednio usunięta.
Prawidłowy format daty
Aby zapewnić, że nasze treści są istotne dla naszych konsumentów, musimy upewnić się, że artykuły, które im pokazujemy, są dokładnie datowane. Daty muszą być wyrażone przy użyciu formatów dat RFC 3339 lub RFC 822.
Prawidłowe przykłady formatu daty:
- Śr. 04 Paź 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Szybkość klikania (CTR)
Współczynnik klikania (CTR) — liczba kliknięć podzielonych przez liczbę wyświetleń — jest jedną miarą zaangażowania używaną do określania rankingu zawartości. Na CTR mają przede wszystkim wpływ elementy zawartości wyświetlane podczas promowania linku, w tym tytuł/nagłówek, obraz i abstrakcja. Uczenie maszynowe ocenia potencjał CTR dla każdego fragmentu zawartości.
Zawartość o wysokim CTR jest na ogół dobra, chociaż istnieje również kategoria zawartości, która może mieć wysoki CTR, ale również generuje niezadowolenie od czytelników - clickbait. Zobacz więcej na ten temat poniżej w naszej sekcji dotyczącej sygnałów ujemnych.
Aktualność i osie czasu
Zawartość kanału informacyjnego powinna być "świeża" i aktualna. W efekcie nowsza zawartość plasuje się średnio wyżej niż starsza zawartość. Najnowsze wiadomości, finanse lub historie sportowe są ważne, ponieważ te pionowe mają tendencję do historii, które szybko się starzeją. Algorytmy rozpoznają inne tematy wydają się być coraz bardziej zielone i pozwalają, aby ta zawartość była starsza, rozpoznając to. Zawartość z nieprawidłowymi datami publikacji może być sklasyfikowana niżej.
Trendy i aktualności
Średnio historie o popularnych tematach, najświeższych wiadomościach i głównych wiadomościach są klasyfikowane bardziej wysoko. Najważniejsze pozycje w kanale informacyjnym są często zarezerwowane dla wiodących wartych opublikowania wiadomości dnia.
Trendy obserwuje się poprzez monitorowanie wielu zewnętrznych źródeł danych, zarówno publicznych, jak i zastrzeżonych. System monitoruje to, co jest popularne w Internecie w ogóle, a także to, co jest popularne na kanwach Microsoft i wyszukiwaniu Bing. Sygnały te są łączone i uśredniane, aby ocenić każdy element zawartości na podstawie jego potencjału trendów. Elementy o większym potencjale są klasyfikowane wyżej w kanale informacyjnym.
Autorytet marki
Historie znanych krajowych lub globalnych wydawców wiadomości mają większą wagę, ponieważ zarówno konsumenci, jak i wydawcy postrzegają je jako bardziej autorytatywne i zaufane. Jednak historie lokalnych lub mniej znanych marek są również ważnymi składnikami spersonalizowanych kanałów informacyjnych i są często wysoko klasyfikowane ze względu na inne sygnały.
Algorytmy nie biorą jeszcze pod uwagę autorytetu według tematu: na przykład niektórzy wydawcy są bardziej autorytatywni w dziedzinie sportu, podczas gdy inni specjalizują się w polityce. Jest to obszar, który firma Microsoft spodziewa się poprawić w przyszłych aktualizacjach rankingu.
Sygnały ujemne i kliknięcia
Niektóre treści generują kliknięcia, ale także generują niezadowolenie ze strony użytkowników, którzy postrzegają nagłówek jako wprowadzający w błąd (nie dostarczając treści obiecanej przez nagłówek) lub historię niższej jakości. Przykłady obejmują nagłówki, które wprowadzają w błąd, wyolbrzymiają historię lub są zbyt szokujące lub emocjonalne. Powszechnie znana jako clickbait, ta zawartość może być klasyfikowana niżej w oparciu o zachowanie użytkownika, które sugeruje niezadowolenie z akcji, takich jak wysoki współczynnik odrzuceń.
Do określonych wzorców należą:
- Nagłówek, który wykracza poza teaser, zwłaszcza z nadużywaniem przysłówka "to" (np. Never Drink This on a Plane).
- Nagłówek, który błędnie przedstawia rzeczywistą zawartość historii i /lub import, nie spełniając w ten sposób oczekiwań czytelnika. Złamana obietnica może wahać się od pominięcia środka trwałego (takiego jak film, do którego odwołuje się nagłówek) lub w ogóle nie dotyczy kluczowych informacji.
Zawartość, która może powodować dyskomfort
W ramach naszych ciągłych wysiłków na rzecz poprawy jakości zawartości i utrzymania pozytywnego doświadczenia dla wszystkich użytkowników, MSN stosuje surowsze standardy do treści, które mogą być postrzegane jako obraźliwe, graficzne lub nieodpowiednie. Wpisy mogą zostać zderioryzowane lub usunięte, jeśli nagłówki, obrazy lub tekst treści zawierają niepokojące lub tytułowe materiały, które nie mają szerszego znaczenia redakcyjnego lub społecznego.
Oto przykłady zawartości, które mogą wyzwalać te sygnały:
- Szczegółowe opisy funkcji ciała (np. wzdęcia, ekskrementy, oddawanie moczu, pryszcze popping)
- Choroby przenoszone drogą płciową
- Sprośne spotkania (np. spotkania z pracownikami seksualnymi, seks publiczny, nagość publiczna), w których nie ma szerszego znaczenia społecznego, takiego jak skandal polityczny.
- Historie kryminalne, które zawierają nadmierne szczegóły (na przykład specyfikę aktu seksualnego lub makabrycznego morderstwa), które wykraczają poza gołe fakty
- Titillating lub dorosłych tematyce historie (np. wyraźne porady seksualne) nie odpowiednie dla ogółu odbiorców
- Zawartość odwołująca się do dewiacji seksualnej i bestialstwa
- Zachowania seksualne zwierząt
- Dekompozycja graficzna (np. mięso zarażone robakami)
Ten typ zawartości może zmniejszyć zaufanie czytelników i jest często oflagowany jako nieodpowiedni dla szerokiego rozpowszechniania.
W zależności od ważności następująca zawartość może mieć ograniczoną ekspozycję lub odpowiednio usunięta, co prowadzi do zmniejszenia wyświetlenia na poziomie artykułu:
- Plotki sławna: Jesteśmy teraz ograniczenie ekspozycji na treści sławna koncentrując się na (ale nie tylko) walki sławna, seksualizacji, co gwiazdy noszą, awarie szafy, z dnia na dzień działalności sławna, problemy z relacjami, itp. Ta zawartość będzie nadal wyświetlana na stronach MSN, jednak będzie dostępna tylko dla użytkowników, którzy szukają tego typu zawartości.