วิธีที่ MSN จัดอันดับเนื้อหา
MSN เผยแพร่เรื่องราวข่าวสาร แกลเลอรีรูปถ่าย และวิดีโอจากผู้เผยแพร่หลายพันรายทั่วโลก และโปรโมตเนื้อหานี้ในผลิตภัณฑ์ของ Microsoft รวมถึง Microsoft Edge, Microsoft Windows, MSN.com และแอป MSN สําหรับอุปกรณ์เคลื่อนที่
แต่ละครั้งที่ผู้บริโภคดูเนื้อหาสรุป MSN ข้อมูลจะรีเฟรชด้วยเนื้อหาที่ปรับให้เป็นแบบส่วนตัวล่าสุด ขึ้นอยู่กับสัญญาณต่างๆอัลกอริทึมเลือกและสั่งซื้อเนื้อหาในฟีดที่มีการควบคุมของบรรณาธิการ ระบบเนื้อหาการจัดอันดับนี้ออกแบบมาเพื่อมีส่วนร่วมและให้ข้อมูลเลือกเรื่องราวที่เกี่ยวข้องมากที่สุดกับแต่ละคนในขณะที่ทําให้แน่ใจว่าเนื้อหานั้นทันเวลาข่าวคุณภาพสูงและปลอดภัยสําหรับที่ทํางานและที่บ้าน
ความสําคัญสัมพัทธ์ของพารามิเตอร์เหล่านี้อาจแตกต่างกันในแต่ละครั้งที่ผู้ใช้ดูฟีดข่าว อัลกอริทึมมีการพัฒนาอยู่เสมอในขณะที่เราระบุและปรับปรุงสัญญาณและทดลองกับคุณลักษณะใหม่ๆ อย่างต่อเนื่อง
ในบทความนี้
ความเกี่ยวข้องของผู้ใช้
Microsoft มอบฟีดข่าวที่ปรับให้เป็นแบบส่วนตัวให้ผู้บริโภคทุกคนเพื่อให้ตรงกับชุดความสนใจและการกําหนดลักษณะเฉพาะของแต่ละบุคคลสําหรับเนื้อหา หลักของการตั้งค่าส่วนบุคคลนี้คืออัลกอริทึมที่ตรงกับการกําหนดลักษณะของผู้ใช้ด้วยการทําความเข้าใจเอกสาร อัลกอริทึมเหล่านี้ออกแบบมาเพื่อเลือกเนื้อหาที่เกี่ยวข้องมากที่สุดสําหรับผู้ใช้แต่ละคน
การกําหนดลักษณะของผู้ใช้จะได้รับการเรียนรู้เมื่อเวลาผ่านไปโดยระบบผ่านสองวิธี:
- การตั้งค่าส่วนบุคคลที่ชัดเจน อัลกอริทึมเคารพวิธีที่ผู้ใช้กําหนดการตั้งค่าของพวกเขาด้วยตนเองรวมถึงการดําเนินการเช่นการติดตามหัวข้อบางอย่างชอบหรือไม่ชอบเนื้อหาที่เฉพาะเจาะจงหรือระบุการกําหนดลักษณะผู้เผยแพร่
- การตั้งค่าส่วนบุคคลโดยนัย เพื่อให้สอดคล้องกับการตั้งค่าความเป็นส่วนตัวของผู้ใช้ ในขณะที่บุคคลอ่านเนื้อหาและมีส่วนร่วมกับผลิตภัณฑ์ของ Microsoft เรื่องราวจะถูกวิเคราะห์สําหรับรูปแบบเพื่อให้เข้าใจการกําหนดลักษณะของผู้ใช้ได้ดียิ่งขึ้น อัลกอริทึมจะมองหารูปแบบทั้งในระยะยาวและระยะสั้นสําหรับผู้ใช้แต่ละราย โดยยอมรับว่าความสนใจของเนื้อหาอาจแตกต่างกันในระยะสั้น ในขณะที่มีแนวโน้มในระยะยาวที่แตกต่างกัน (อ่านเพิ่มเติมเกี่ยวกับความเป็นส่วนตัวของ Microsoft ที่นี่)
อัลกอริทึมการเรียนรู้ของเครื่องขับเคลื่อนความเข้าใจเอกสารเชิงลึกนอกเหนือจากการจดจํา 'หัวข้อ': ระบบจะทําการวิเคราะห์เอกสารแต่ละฉบับเพื่อรับข้อมูลเชิงลึกโดยยึดตามข้อความและเมตาดาต้าและแปลงเนื้อหาเป็นรูปแบบทางคณิตศาสตร์
สองรูปแบบทางคณิตศาสตร์ - การกําหนดลักษณะผู้ใช้และความเข้าใจเอกสาร - สามารถเปรียบเทียบเพื่อเลือกเนื้อหาที่ใกล้เคียงที่สุดสําหรับแต่ละบุคคล
นอกเหนือจากเนื้อหาที่ตรงกับผู้ใช้แต่ละคนโดยตรงแล้วอัลกอริทึมยังค้นหาเนื้อหาที่ดึงดูดผู้ใช้ที่มีความชอบคล้ายกัน
การจัดรูปแบบ
เราต้องการโปรโมตเนื้อหาที่มีคุณภาพในฟีดของเราที่ไม่มีข้อบกพร่องด้านการมองเห็น เช่น องค์ประกอบส่วนหัวที่ขาดหายไป รายการ URL ที่หายไป หรือคํา/วลีที่ไม่เกี่ยวข้องที่ส่งผลให้ผู้ใช้ได้รับประสบการณ์การใช้งานที่ไม่ดี เพื่อหลีกเลี่ยงไม่ให้เนื้อหาของคุณเห็นการเปิดเผยที่จํากัด โปรดตรวจสอบให้แน่ใจว่าคุณปฏิบัติตามแนวทางการเผยแพร่รวมถึงรายการต่อไปนี้:
บล็อกยาวของข้อความที่ไม่จัดรูปแบบ
เนื้อหาที่มีคุณภาพสูงและไม่มีข้อบกพร่อง เช่น ข้อความที่ไม่ได้รับการจัดรูปแบบจะมีความน่าจะสูงกว่าในการมองเห็นในฟีด ตรวจสอบให้แน่ใจว่ามีประโยคและโครงสร้างย่อหน้าและการเขียนโค้ดที่เหมาะสมเมื่อคุณอัปโหลด บทความที่ไม่มีตัวแบ่งบรรทัดหรือตัวแบ่งย่อหน้าจะไม่ได้รับการเลื่อนระดับในเนื้อหาสรุป
ตัวอย่างของข้อความที่จัดรูปแบบ: <p>นี่คือย่อหน้า</p> (โปรดสังเกตรหัสเปิดและปิด)
ลิงก์บทความต้นฉบับ
ลิงก์กลับไปยังบทความต้นฉบับสามารถปรากฏที่ด้านล่างของบทความเท่านั้น โพสต์ที่ลิงก์กลับไปยังต้นฉบับภายในเนื้อความหลักของข้อความจะมีการเข้าถึงที่จํากัด
URL ข้อความธรรมดา
ถ้าคุณมีลิงก์ในเนื้อหาของคุณ คุณจําเป็นต้องตรวจสอบให้แน่ใจว่าลิงก์เหล่านั้นได้รับการจัดรูปแบบอย่างเหมาะสม ตัวอย่างเช่น หากลิงก์ในเนื้อหาของคุณมีลักษณะดังนี้: https://www.conotoso.com/r/linden-new-york การจัดรูปแบบเนื้อหาของคุณไม่ถูกต้องและอาจมีการจํากัดการเปิดเผยหรือถูกลบออกตามนั้น
รูปแบบวันที่ที่ถูกต้อง
เพื่อให้แน่ใจว่าเนื้อหาของเราเกี่ยวข้องกับผู้บริโภคของเราเราต้องตรวจสอบให้แน่ใจว่าบทความที่เราแสดงนั้นลงวันที่อย่างถูกต้อง วันที่ต้องแสดงโดยใช้รูปแบบวันที่ RFC 3339 หรือ RFC 822
ตัวอย่างรูปแบบวันที่ที่ถูกต้อง:
- พ. 04 ต.ค. 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
อัตราการคลิกผ่าน (CTR)
อัตราการคลิกผ่าน (CTR) คือจํานวนคลิกที่หารด้วยจํานวนการแสดงผล ซึ่งเป็นหนึ่งในการวัดการมีส่วนร่วมที่ใช้ในการกําหนดการจัดอันดับเนื้อหา ส่วนใหญ่แล้ว CTR จะได้รับผลกระทบจากองค์ประกอบของเนื้อหาที่แสดงเมื่อโปรโมตลิงก์ รวมถึงชื่อเรื่อง/พาดหัว รูปภาพ และนามธรรม แมชชีนเลิร์นนิ่งจะตัดสินศักยภาพของ CTR สําหรับเนื้อหาแต่ละส่วน
เนื้อหาที่มี CTR สูงโดยทั่วไปจะดี แม้ว่าจะมีประเภทของเนื้อหาที่อาจมี CTR สูง แต่ก็สร้างความไม่พอใจจากผู้อ่าน - clickbait ดูข้อมูลเพิ่มเติมด้านล่างนี้ได้ในส่วนของเราเกี่ยวกับสัญญาณลบ
ความสดใหม่และไทม์ไลน์
เนื้อหาในฟีดข่าวคาดว่าจะเป็น "ใหม่" และทันเวลา ดังนั้นเนื้อหาที่ใหม่กว่าจึงจัดอันดับสูงกว่าเนื้อหาที่เก่ากว่าโดยเฉลี่ย ข่าวการเงินหรือเรื่องราวกีฬาล่าสุดมีความสําคัญเนื่องจากแนวตั้งเหล่านี้มักจะมีเรื่องราวยุคนั้นอย่างรวดเร็ว อัลกอริทึมนี้รู้จักหัวข้ออื่น ๆ มีแนวโน้มที่จะใหญ่ขึ้นเรื่อย ๆ และทําให้เนื้อหานี้เก่ากว่าและตระหนักถึงสิ่งนั้น เนื้อหาที่มีวันที่เผยแพร่ที่ไม่ถูกต้องอาจถูกจัดอันดับให้ต่ําลง
แนวโน้มและข่าวล่าสุด
โดยเฉลี่ยแล้วเรื่องราวเกี่ยวกับหัวข้อที่กําลังเป็นที่นิยม ข่าวด่วน และข่าวพาดหัวจะถูกจัดอันดับให้สูงขึ้น ตําแหน่งด้านบนในฟีดมักถูกสงวนไว้สําหรับข่าวสําคัญประจําวัน
แนวโน้มจะสังเกตได้จากการตรวจสอบแหล่งข้อมูลภายนอกหลายแหล่ง ทั้งแบบสาธารณะและที่เป็นกรรมสิทธิ์ ระบบจะตรวจสอบสิ่งที่กําลังเป็นที่นิยมบนอินเทอร์เน็ตที่มีขนาดใหญ่ รวมถึงสิ่งที่กําลังได้รับความนิยมบนผืนผ้าใบของ Microsoft และการค้นหาของ Bing สัญญาณเหล่านี้จะถูกรวมเข้าด้วยกันและเฉลี่ยเพื่อจัดอันดับรายการเนื้อหาแต่ละรายการที่มีศักยภาพที่จะได้รับความนิยม รายการที่มีศักยภาพมากขึ้นจะถูกจัดอันดับให้สูงขึ้นในฟีด
หน่วยงานของแบรนด์
เรื่องราวจากผู้เผยแพร่ข่าวระดับชาติหรือระดับโลกที่เป็นที่รู้จักมีน้ําหนักมากกว่า เนื่องจากผู้บริโภคและผู้เผยแพร่ต่างก็มองว่าผู้เผยแพร่เหล่านั้นมีอํานาจและน่าเชื่อถือมากกว่า อย่างไรก็ตามเรื่องราวจากแบรนด์ในท้องถิ่นหรือแบรนด์ที่มีชื่อเสียงน้อยกว่าก็เป็นส่วนประกอบสําคัญของฟีดที่ปรับให้เป็นแบบส่วนตัวและมักถูกจัดอันดับสูงเนื่องจากสัญญาณอื่น ๆ
อัลกอริทึมยังไม่พิจารณาอํานาจตามหัวข้อ: ตัวอย่างเช่นผู้เผยแพร่บางรายมีอํานาจในพื้นที่ของกีฬาในขณะที่คนอื่นมีความเชี่ยวชาญในการเมือง นี่คือพื้นที่ที่ Microsoft คาดว่าจะปรับปรุงในการอัปเดตการจัดอันดับในอนาคต
สัญญาณติดลบและคลิกเบต
เนื้อหาบางอย่างสร้างการคลิก แต่ยังสร้างความไม่พอใจจากผู้ใช้ที่มองว่าพาดหัวข่าวทําให้เข้าใจผิด (ไม่ได้นําเสนอเนื้อหาที่พาดหัวสัญญาไว้) หรือเรื่องราวที่มีคุณภาพต่ํา ตัวอย่างเช่น พาดหัวข่าวที่ทําให้เข้าใจผิด ทําให้เรื่องราวเกินจริง หรือน่าตกใจหรืออารมณ์มากเกินไป ซึ่งเป็นที่รู้จักกันดีว่า clickbait เนื้อหานี้อาจถูกจัดอันดับให้ต่ํากว่าตามพฤติกรรมของผู้ใช้ที่แนะนําความไม่พอใจผ่านการดําเนินการต่างๆ เช่น อัตราการตีกลับสูง
รูปแบบที่เฉพาะเจาะจงประกอบด้วย:
- พาดหัวที่นอกเหนือไปจากทีเซอร์โดยเฉพาะกับการใช้คํากริยาวิเศษณ์ "นี้" มากเกินไป (เช่น อย่าดื่มนี้บนเครื่องบิน)
- พาดหัวที่อธิบายเนื้อหาเรื่องราวจริงและ/หรือนําเข้าอย่างไม่ถูกต้อง จึงไม่เป็นไปตามความคาดหวังของผู้อ่าน คํามั่นสัญญาที่เสียหายอาจเกิดจากการละเว้นสินทรัพย์ (เช่น วิดีโอที่อ้างอิงในพาดหัว) หรือไม่ระบุข้อมูลสําคัญเลย
เนื้อหาที่อาจทําให้เกิดความไม่สบาย
ในฐานะที่เป็นส่วนหนึ่งของความพยายามอย่างต่อเนื่องของเราในการปรับปรุงคุณภาพเนื้อหาและรักษาประสบการณ์เชิงบวกสําหรับผู้ใช้ทั้งหมด MSN ใช้มาตรฐานที่เข้มงวดยิ่งขึ้นกับเนื้อหาที่อาจมองว่าไม่เหมาะสม กราฟิก หรือไม่เหมาะสม โพสต์อาจถูกกีดกันหรือถูกนําออกหากพาดหัว รูปภาพ หรือเนื้อความมีเนื้อหาที่รบกวนหรือเอียงซึ่งขาดความเกี่ยวข้องของบรรณาธิการหรือสังคมที่กว้างขึ้น
ตัวอย่างของเนื้อหาที่อาจทริกเกอร์สัญญาณเหล่านี้ ได้แก่:
- การแสดงรายละเอียดของฟังก์ชันทางร่างกาย (เช่น ท้องอืด, ขับถ่าย, ปัสสาวะ, สิวผุด)
- โรคติดต่อทางเพศสัมพันธ์
- Lewd พบ (เช่นการประชุมกับคนงานทางเพศเพศเพศภาพเปลือยสาธารณะ) ที่ไม่มีความเกี่ยวข้องทางสังคมที่กว้างขวางเช่นเรื่องอื้อฉาวทางการเมือง
- เรื่องราวอาชญากรรมที่มีรายละเอียดมากเกินไป (ตัวอย่างเช่นรายละเอียดของการกระทําทางเพศหรือการฆาตกรรมที่น่ากลัว) ที่ไปเกินกว่าข้อเท็จจริงที่เปล่า
- เรื่องราวที่น่าตื่นเต้นหรือธีมสําหรับผู้ใหญ่ (เช่น คําแนะนําทางเพศที่ชัดเจน) ไม่เหมาะสมสําหรับผู้ชมทั่วไป
- เนื้อหาที่อ้างถึงความเบี่ยงเบนทางเพศและความดีที่สุด
- พฤติกรรมทางเพศของสัตว์
- การสลายตัวของกราฟิก (เช่น เนื้อสัตว์ที่ติดหนอนด้วยหนอน)
เนื้อหาชนิดนี้อาจลดความเชื่อถือของผู้อ่านและมักถูกตั้งค่าสถานะว่าไม่เหมาะสมสําหรับการแจกจ่ายในวงกว้าง
ขึ้นอยู่กับความรุนแรง เนื้อหาต่อไปนี้อาจมีการจํากัดจํานวนหรือลบออกตามนั้น ซึ่งนําไปสู่การลดการแสดงผลในระดับบทความ:
- ซุบซิบคนดัง: ขณะนี้เรากําลังจํากัดการเปิดรับเนื้อหาชื่อเสียงที่เน้น (แต่ไม่จํากัดเพียง) การต่อสู้เพื่อคนดัง การมีเพศสัมพันธ์กับดาราที่กําลังสวม อยู่ ตู้เสื้อผ้าทํางานผิดปกติ กิจกรรมชื่อเสียงในแต่ละวัน ปัญหาความสัมพันธ์ เป็นต้น อย่างไรก็ตาม เนื้อหานี้จะยังคงปรากฏบนเพจ MSN เฉพาะผู้ใช้ที่ค้นหาเนื้อหาชนิดนี้เท่านั้น