MSN 如何為內容排名
MSN 發布來自全球數千家出版商的新聞報導、相簿與影片,並透過包括 Microsoft Edge、Microsoft Windows、MSN.com 及 MSN 行動應用程式在Microsoft產品中推廣這些內容。
每當消費者瀏覽 MSN 動態時,它會更新為最新的個人化內容。 根據各種訊號,演算法在編輯監督下選擇並排序內容。 這個排名內容系統旨在吸引並告知讀者,選擇對每個人最相關的故事,同時確保內容及時、具新聞價值、高品質,且適合工作與居家使用。
這些參數的相對重要性,每次使用者瀏覽新聞動態時都會有所不同。 隨著我們不斷識別、改進訊號並嘗試新功能,演算法也在不斷演進。
本文內容
使用者相關性
Microsoft 為每位消費者提供個人化的新聞動態,以滿足每個人獨特的興趣與內容偏好。 這種個人化的核心是演算法,能將使用者偏好與文件理解相結合。 這些演算法旨在為每位使用者挑選最相關的內容。
系統會透過兩種方式隨時間學習使用者的偏好:
- 明確的個人化。 演算法尊重使用者手動設定的方式,包括追蹤特定主題、按讚或不按讚特定內容,或顯示出版商偏好。
- 隱性個人化。 為了符合使用者的隱私設定,當個人閱讀內容並接觸 Microsoft 產品時,故事會被分析以找出模式,以更好地理解使用者的偏好。 演算法同時尋找每位使用者的長期與短期模式,承認內容興趣在短期內可能不同,且長期趨勢也有所不同。 (在這裡閱讀更多 關於Microsoft隱私 的資訊) 。
機器學習演算法推動深入的文件理解,超越單純辨識「主題」:系統對每份文件進行分析,根據文字與元資料獲得洞見,並將內容轉換為數學模型。
兩種數學模型——使用者偏好與文件理解——可以比較為選擇最接近每個人的內容。
除了直接與每位用戶配對內容外,演算法也會搜尋能吸引相似偏好用戶的內容。
格式設定
我們希望推廣動態中沒有視覺缺陷的優質內容,例如缺少標頭元素、缺少清單文、缺少網址,或是導致不良使用者體驗的無關詞語/片語。 為避免內容曝光受限,請確保遵守發布指引,包括以下內容:
長段未格式化文字
高品質且沒有像未格式文字這類缺陷的內容,更容易在動態中被看到。 上傳時務必確保有正確的句子和段落結構,以及正確的程式碼。 沒有換行或段落分隔的文章不會在動態中被推廣。
格式化文字範例: <p>這是一個段落。</p> (請注意開門與閉門代碼) 。
原始文章連結
回溯至原始文章的連結只能出現在文章底部。 在正文中連結回原文的貼文,觸及度有限。
純文字網址
如果你的內容中有連結,請確保它們格式正確。 例如,如果你的內容中的連結看起來像這樣:https://www.contoso.com/r/linden-new-york,代表你的內容格式不正確,曝光有限或會被相應移除。
有效日期格式
為了確保我們的內容與消費者相關,我們必須確保展示給他們的文章具有準確的年代。 日期必須使用 RFC 3339 或 RFC 822 日期格式來表示。
有效日期格式範例:
- 2017年10月4日 星期三 15:00:00 +0200
- 2017-10-04T08:00:00-05:00
點選率 (CTR)
點擊率 (點擊率) ——點擊數除以曝光數——是用來決定內容排名的互動度指標之一。 CTR 主要受推廣連結時所呈現的內容元素影響,包括標題/標題、圖片及摘要。 機器學習評估每篇內容的點擊率潛力。
高點擊率的內容通常不錯,雖然也有一類內容雖然點擊率高,但也會引起讀者不滿——誘餌。 請參考下方我們關於 負面訊號的章節。
新鮮度與及時性
新聞動態中的內容被期望是「新鮮」且及時的。 因此,平均來說,新內容的排名高於舊內容。 最新的新聞、財經或體育報導很重要,因為這些垂直領域往往有過時的新聞。 演算法會辨識其他主題較為常青,並允許這些內容較舊,這點也已認知到。 發表日期不準確的內容可能會被排在較低的排名。
趨勢與新聞價值
平均而言,關於熱門話題、突發新聞和頭條新聞的報導排名較高。 該新聞來源的頂端通常保留給當天最具價值的新聞。
趨勢是透過監控多個外部資料來源(包括公開與專有)來觀察。 系統會監控網路上的熱門趨勢,以及 Microsoft 的 canvass 和 Bing 搜尋的熱門趨勢。 這些訊號會被合併並平均,以評分每個內容的熱門潛力。 潛力較高的商品會在動態中排名較高。
品牌權威
知名全國或全球新聞出版社的報導權重較高,因為消費者和出版商都認為它們更具權威性且值得信賴。 然而,來自本地或較不知名品牌的故事也是個人化動態的重要組成部分,且常因其他訊號而排名靠前。
演算法尚未依主題考量權威性:例如,有些出版商在體育領域更具權威性,而另一些則專注於政治。 這是 Microsoft 預期未來排名更新中能改進的領域。
負面訊號與誘餌
有些內容會帶來點擊,但也會讓用戶感到不滿,因為標題誤導 (未能達到) 標題承諾的內容,或是故事品質較低。 例如標題誤導、誇大故事,或過於震驚或情緒化。 這類內容俗稱標題誘餌,可能會根據用戶行為被排得較低,這些行為顯示出不滿意,例如跳出率高。
具體的模式包括:
- 這個標題已經超越了預告,尤其是過度使用副詞「this」 (例如「Never Drink on a plane) 」。
- 標題誤導了故事內容和/或重要性,未能符合讀者的期待。 失信可能包括遺漏 (資產,例如標題) 中提及的影片,甚至根本不涉及關鍵資訊。
可能造成不適的內容
作為我們持續提升內容品質並維持所有用戶正面體驗的努力之一,MSN 對可能被視為冒犯、血腥或不當的內容採取更嚴格的標準。 若標題、圖片或正文包含令人不安或挑釁的內容,且缺乏更廣泛的編輯或社會相關性,文章可能會被降級或移除。
可能觸發這些訊號的內容範例包括:
- 詳細描繪身體功能, (如放屁、排便、排尿、擠痘痘等)
- 性傳染病
- 猥褻 (會遇到例如與性工作者會面、公開性行為、公共裸體) 與社會無關的政治醜聞等場合。
- 犯罪故事中包含過度細節 (例如性行為細節或駭人聽聞的謀殺) 超越單純事實
- 挑逗性或成人主題的故事,例如露骨的性建議 (不適合一般觀眾)
- 內容涉及性偏差與獸交
- 動物性行為
- 圖像分解 (例如肉類被蛆侵擾)
這類內容可能降低讀者信任度,且常被標記為不適合廣泛散布。
根據嚴重程度,以下內容可能曝光有限或相應移除,導致文章層級的曝光量下降:
- 名人八卦:我們現在限制聚焦於 (但不限於) 名人爭吵、性化名人穿著、服裝失調、日常名人活動、感情問題等名人內容的曝光。這些內容仍會出現在 MSN 頁面上,但只會讓尋求此類內容的用戶看到。