MSN がコンテンツをランク付けする方法

MSN は、世界中の何千ものパブリッシャーからニュース 記事、フォト ギャラリー、ビデオを公開し、Microsoft Edge、Microsoft Windows、MSN.com、MSN モバイル アプリなど、Microsoft 製品全体でこのコンテンツを宣伝しています。

コンシューマーが MSN フィードを表示するたびに、最新のパーソナライズされたコンテンツで更新されます。 さまざまなシグナルに基づいて、アルゴリズムはフィード内のコンテンツを選択して注文し、編集の監督を行います。 このランキング コンテンツ システムは、エンゲージメントと通知を行い、各ユーザーに最も関連性の高いストーリーを選択し、コンテンツがタイムリーでニュースに適しており、高品質で、職場や家庭でも安全であることを保証するように設計されています。

これらのパラメーターの相対的な重要度は、ユーザーがニュース フィードを表示するたびに異なる場合があります。 シグナルを継続的に特定して改善し、新機能を試すにつれて、アルゴリズムは常に進化しています。

この記事の内容

ユーザーの関連性

書式設定

クリック率 (CTR)

鮮度とタイムライン

傾向とニュース価値

ブランドオーソリティ

負の信号とクリックベイト

ユーザーの関連性

Microsoft では、各ユーザーの一意の関心とコンテンツの好みを満たすために、すべてのコンシューマーにパーソナライズされたニュース フィードを提供します。 このパーソナル化の中核となるのは、ユーザー設定とドキュメント理解に一致するアルゴリズムです。 これらのアルゴリズムは、ユーザーごとに最も関連性の高いコンテンツを選択するように設計されています。

ユーザーの好みは、2 つの方法でシステムによって時間の経過と同時に学習されます。

  • 明示的なパーソナル化。 このアルゴリズムは、特定のトピックのフォロー、特定のコンテンツの好き嫌い、発行元の好みを示すアクションなど、ユーザーが手動で設定を構成する方法を尊重します。
  • 暗黙的なパーソナル化。 ユーザーのプライバシー設定に準拠して、ユーザーがコンテンツを読み取り、Microsoft の製品に取り組むにつれて、ストーリーはパターンについて分析され、ユーザーの好みを理解しやすくなります。 このアルゴリズムは、各ユーザーの長期的パターンと短期パターンの両方を探し、コンテンツの関心が短期的に異なる可能性があることを認識しながら、異なる長期的傾向を示します。 (Microsoft プライバシーの詳細 については、こちらを参照してください)。

機械学習アルゴリズムは、単に "トピック" を認識するだけでなく、ドキュメントの深い理解を促進します。システムは、各ドキュメントに対して分析を実行して、テキストとメタデータに基づいて分析情報を取得し、コンテンツを数学的モデルに変換します。

ユーザー設定とドキュメント理解という 2 つの数学的モデルを比較して、一人一人に最も近いコンテンツを選択できます。

アルゴリズムは、各ユーザーとコンテンツを直接照合するだけでなく、同様の設定でユーザーを引き付けたコンテンツも検索します。

書式設定

ヘッダー要素の欠落、リストクルの欠落、URL の欠落、ユーザー エクスペリエンスの低下につながる無関係な単語/フレーズなどの視覚的な欠陥のない、フィードの品質コンテンツを促進したいと考えています。 コンテンツの公開が制限されないようにするには、次のような公開ガイドラインに従っていることを確認してください。

書式設定されていないテキストの長いブロック

高品質で、書式設定されていないテキストなどの欠陥のないコンテンツは、フィードで可視性を得る確率が高くなります。 アップロードするときに、適切な文と段落の構造とコーディングがあることを確認します。 改行や段落区切りのない記事は、フィードで昇格されません。

書式設定されたテキストの例: <p>これは paragraph.</p> (開始コードと終了コードに注意してください)。

元の記事のリンク

元の記事へのリンクは、記事の下部にのみ表示されます。 テキストの本文内で元に戻るリンクを投稿すると、リーチが制限されます。

プレーンテキスト URL

コンテンツにリンクがある場合は、リンクが適切に書式設定されていることを確認する必要があります。 たとえば、コンテンツ内のリンクが次のように見える場合:https://www.conotoso.com/r/linden-new-york、コンテンツは正しく書式設定されず、露出が制限されたり、それに応じて削除されたりする可能性があります。

有効な日付形式

コンテンツが消費者に関連していることを確認するには、表示される記事が正確に日付付けされていることを確認する必要があります。 日付は、RFC 3339 または RFC 822 日付形式を使用して表す必要があります。

有効な日付形式の例:

  • 2017 年 10 月 4 日 (日) 15:00:00 +0200
  • 2017-10-04T13:00:00+00:00

クリック率 (CTR)

クリック率 (CTR) は、クリック数をインプレッション数で割った値です。これは、コンテンツのランク付けの決定に使用されるエンゲージメントの 1 つの尺度です。 CTR は主に、タイトル/見出し、画像、抽象など、リンクを宣伝するときに表示されるコンテンツの要素の影響を受けます。 機械学習は、コンテンツごとに CTR の可能性を判断します。

CTR が高いコンテンツは一般的に良好ですが、CTR が高いコンテンツのカテゴリもありますが、読者から不満を生み出す場合もあります 。クリックベイト。 この詳細については、 以下の「負の信号」セクションを参照してください。

鮮度とタイムライン

ニュース フィード内のコンテンツは、"新鮮" でタイムリーであると予想されます。 その結果、新しいコンテンツは、平均して古いコンテンツよりも上位になります。 ニュース、財務、スポーツの最新の記事は重要です。これらの縦書きには、すぐに年齢を重ねている物語が存在する傾向があるためです。 アルゴリズムは、他のトピックがより常緑化する傾向があることを認識し、このコンテンツを古くすることを可能にします。 公開日が不正確なコンテンツは、ランクが低くなる可能性があります。

平均して、トレンドトピック、ニュース速報、見出しニュースに関する記事は、より高くランク付けされています。 フィードの上位の位置は、多くの場合、その日の主要なニュース価値のあるニュースのために予約されています。

傾向は、パブリックとプロプライエタリの両方の複数の外部データ ソースを監視することによって観察されます。 このシステムは、インターネット上で何がトレンドになっているかだけでなく、Microsoft キャンバスやBing検索で何がトレンドになっているかを監視します。 これらのシグナルが組み合わされ、平均化され、各コンテンツ アイテムがトレンドになる可能性を評価します。 可能性が高いアイテムは、フィードの上位にランク付けされます。

ブランドオーソリティ

有名な国内またはグローバルのニュースパブリッシャーからのストーリーは、消費者とパブリッシャーが同様に、より権威があり信頼されたと見なすので、重い重みを持っています。 しかし、ローカルまたはあまり知られていないブランドからの物語は、パーソナライズされたフィードの重要なコンポーネントであり、多くの場合、他のシグナルのために高くランク付けされています。

アルゴリズムは、トピック別の権限をまだ考慮していません。たとえば、一部のパブリッシャーはスポーツ分野でより権威があり、他のパブリッシャーは政治を専門としています。 これは、Microsoft が今後のランク付け更新プログラムで改善する予定の領域です。

負の信号とクリックベイト

一部のコンテンツはクリックを生成しますが、見出しが誤解を招く (見出しが約束したコンテンツを配信していない) か、品質の低いストーリーを認識するユーザーからの不満も発生します。 たとえば、誤解を招く、ストーリーを誇張する、過度に衝撃的または感情的な見出しが含まれます。 一般的にクリックベイトと呼ばれるこのコンテンツは、高い直帰率などのアクションによる不満を示唆するユーザーの行動に基づいて低くランク付けされる可能性があります。

具体的なパターンは次のとおりです。

  • 特に副詞「this」の過剰使用(例えば、平面上でこれを飲むことはありません)で、ティーザーを超えた見出し。
  • 実際のストーリーコンテンツやインポートを誤って表示し、それによって読者の期待を満たさなかった見出し。 壊れた約束は、資産 (見出しで参照されているビデオなど) を省略することや、重要な情報にまったく対処しない場合があります。

不快感を与える可能性のあるコンテンツ

コンテンツの品質を向上させ、すべてのユーザーに肯定的なエクスペリエンスを維持するための継続的な取り組みの一環として、MSN は、不快、グラフィック、または不適切と見なされる可能性のあるコンテンツに対して、より厳しい基準を適用します。 見出し、画像、本文に、より広範な編集や社会的関連性を欠く不穏な資料や刺激的な資料が含まれている場合、投稿は枯渇または削除される可能性があります。

これらのシグナルをトリガーする可能性があるコンテンツの例を次に示します。

  • 身体機能の詳細な描写(鼓腸、排泄物、排尿、吹き出しなど)
  • 性感染症
  • 政治的スキャンダルなどの広範な社会的関連性がないみだらな出会い(セックスワーカーとの会議、公衆セックス、公共ヌードなど)。
  • 裸の事実を超えた過度の詳細(例えば、性的行為や恐ろしい殺人の詳細)を含む犯罪の話
  • 大人をテーマにしたストーリー (明示的な性的アドバイスなど) は、一般の視聴者には適していません
  • 性的逸脱と獣姦を参照するコンテンツ
  • 動物性行動
  • グラフィック分解 (例: マゴがはびこる肉)

この種類のコンテンツは、閲覧者の信頼を低下させる可能性があり、多くの場合、広範な配布に不適切としてフラグが設定されます。

重大度によっては、次のコンテンツの露出が制限されたり、それに応じて削除されたりして、記事レベルのインプレッションが減少する可能性があります。

  • 有名人のゴシップ:私たちは今、有名人の戦いに焦点を当てた有名人のコンテンツの露出を制限し、有名人が身に着けているものを性的にし、ワードローブの誤動作、日々の有名人の活動、関係の問題などを制限しています。このコンテンツは引き続き MSN ページに表示されますが、この種類のコンテンツを探しているユーザーにのみ公開されます。