Cara MSN memberi peringkat konten
MSN menerbitkan berita, galeri foto, dan video dari ribuan penerbit secara global dan mempromosikan konten ini di seluruh produk Microsoft, termasuk Microsoft Edge, Microsoft Windows, MSN.com, dan aplikasi seluler MSN.
Setiap kali konsumen melihat umpan MSN, umpan akan direfresh dengan konten terbaru yang dipersonalisasi. Berdasarkan berbagai sinyal, algoritma memilih dan mengurutkan konten dalam umpan dengan pengawasan editorial. Sistem konten peringkat ini dirancang untuk melibatkan dan menginformasikan, memilih cerita yang paling relevan bagi setiap orang, sekaligus memastikan konten tepat waktu, layak diberitakan, berkualitas tinggi, dan aman untuk kantor dan rumah.
Kepentingan relatif dari parameter ini dapat bervariasi setiap kali umpan berita ditampilkan oleh pengguna. Algoritma selalu berkembang saat kami terus mengidentifikasi dan meningkatkan sinyal serta bereksperimen dengan fitur baru.
Di artikel ini
Relevansi pengguna
Microsoft memberikan umpan berita yang dipersonalisasi kepada setiap konsumen untuk memenuhi sekumpulan minat dan preferensi unik setiap orang untuk konten. Inti dari personalisasi ini adalah algoritma yang sesuai dengan preferensi pengguna dengan pemahaman dokumen. Algoritma ini dirancang untuk memilih konten yang paling relevan untuk setiap pengguna.
Preferensi pengguna dipelajari seiring waktu oleh sistem melalui dua pendekatan:
- Personalisasi eksplisit. Algoritma menghargai cara pengguna mengonfigurasi pengaturan mereka secara manual, termasuk tindakan seperti mengikuti topik tertentu, menyukai atau tidak menyukai konten tertentu, atau mengindikasikan preferensi penerbit.
- Personalisasi implisit. Sesuai dengan pengaturan privasi pengguna, saat seseorang membaca konten dan terlibat dengan produk Microsoft, cerita dianalisis untuk pola agar lebih memahami preferensi pengguna. Algoritma mencari pola jangka panjang dan jangka pendek untuk setiap pengguna, mengakui bahwa minat konten dapat bervariasi dalam jangka pendek, sementara menunjukkan kecenderungan jangka panjang yang berbeda. (Baca selengkapnya tentang Privasi Microsoft di sini).
Algoritma pembelajaran mesin mendorong pemahaman dokumen yang mendalam selain sekadar mengenali 'topik': Sistem melakukan analisis pada setiap dokumen untuk mendapatkan wawasan berdasarkan teks dan metadata dan mengonversi konten menjadi model matematika.
Dua model matematika – preferensi pengguna dan pemahaman dokumen – dapat dibandingkan dengan memilih konten yang paling cocok untuk setiap orang.
Selain langsung mencocokkan konten dengan setiap pengguna, algoritma juga mencari konten yang melibatkan pengguna dengan preferensi serupa.
Pemformatan
Kami ingin mempromosikan konten kualitas dalam umpan kami yang tidak memiliki cacat visual seperti elemen header yang hilang, listicle yang hilang, URL yang hilang, atau kata/frasa yang tidak terkait yang mengakibatkan pengalaman pengguna yang buruk. Untuk menghindari konten Anda melihat paparan terbatas, pastikan Anda mengikuti panduan penerbitan termasuk yang berikut ini:
Blok panjang teks yang tidak diformat
Konten yang berkualitas tinggi dan tanpa cacat seperti teks yang tidak diformat memiliki probabilitas yang lebih tinggi untuk mendapatkan visibilitas dalam umpan. Pastikan kalimat dan paragraf memiliki struktur dan pengodean yang tepat saat Anda mengunggahnya. Artikel tanpa hentian baris atau hentian paragraf tidak akan dipromosikan dalam umpan.
Contoh teks yang diformat: <p>Ini adalah paragraf.</p> (Perhatikan kode buka dan tutup).
Tautan artikel asli
Tautan kembali ke artikel asli hanya dapat muncul di bagian bawah artikel. Postingan yang menautkan kembali ke yang asli dalam isi utama teks akan memiliki jangkauan terbatas.
Plaintext URL
Jika memiliki tautan dalam konten, Anda perlu memastikan bahwa tautan telah diformat dengan benar. Misalnya, jika tautan dalam konten Anda terlihat seperti ini: https://www.conotoso.com/r/linden-new-york maka konten Anda tidak diformat dengan benar dan mungkin memiliki paparan terbatas atau dihapus.
Format tanggal yang valid
Untuk memastikan konten kami relevan dengan konsumen, kami harus memastikan bahwa artikel yang kami perlihatkan sudah tertanggal secara akurat. Tanggal harus dinyatakan menggunakan format tanggal RFC 3339 atau RFC 822.
Contoh format tanggal yang valid:
- Rabu, 04 Okt 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
Tingkat klik-melalui (CTR)
Tingkat klik-melalui (CTR) — jumlah klik yang dibagi dengan jumlah tayangan - adalah salah satu ukuran keterlibatan yang digunakan dalam menentukan peringkat konten. CTR terutama dipengaruhi oleh elemen konten yang ditampilkan saat mempromosikan tautan, termasuk judul/judul, gambar, dan abstrak. Pembelajaran mesin menilai potensi CTR untuk setiap konten.
Konten dengan CTR tinggi umumnya bagus, meskipun ada juga kategori konten yang mungkin memiliki CTR tinggi tetapi juga menghasilkan ketidakpuasan dari pembaca - clickbait. Lihat selengkapnya di bawah ini di bagian kami tentang Sinyal negatif.
Kesegaran dan ketepatan waktu
Konten dalam umpan berita diharapkan "segar" dan tepat waktu. Sebagai hasilnya, konten yang lebih baru memiliki peringkat lebih tinggi dari konten lama, secara rata-rata. Berita, keuangan, atau kisah olahraga terbaru penting karena vertikal ini cenderung memiliki cerita yang menua dengan cepat. Algoritma mengenali topik lain cenderung lebih cemburu dan memungkinkan konten ini menjadi lebih tua, mengenalinya. Konten dengan tanggal penerbitan yang tidak akurat mungkin memiliki peringkat yang lebih rendah.
Tren dan kelayakan berita
Rata-rata, cerita tentang topik yang sedang tren, berita terbaru, dan berita utama diberi peringkat yang lebih tinggi. Posisi teratas dalam umpan sering dicadangkan untuk berita berita terkemuka hari ini.
Tren diamati dengan memantau beberapa sumber data eksternal, baik publik maupun milik. Sistem memantau apa yang sedang tren di internet secara luas, serta apa yang sedang tren di kanvas Microsoft dan pencarian Bing. Sinyal ini digabungkan dan dirata-ratakan untuk menilai setiap item konten tentang potensinya menjadi tren. Item dengan potensi lebih tinggi diberi peringkat lebih tinggi dalam umpan.
Otoritas merek
Cerita dari penerbit berita nasional atau global yang terkenal memiliki bobot yang lebih berat, karena konsumen dan penerbit sama-sama melihatnya sebagai lebih otoritatif dan tepercaya. Namun, cerita dari merek lokal atau kurang terkenal juga merupakan komponen penting dari umpan yang dipersonalisasi dan sering diberi peringkat tinggi karena sinyal lain.
Algoritma belum mempertimbangkan otoritas berdasarkan topik: misalnya, beberapa penerbit lebih otoritatif di bidang olahraga, sementara yang lain mengkhususkan diri dalam politik. Ini adalah area yang microsoft harapkan untuk disempurnakan dalam pembaruan peringkat mendatang.
Sinyal negatif dan clickbait
Beberapa konten menghasilkan klik, tetapi juga menghasilkan ketidakpuasan dari pengguna yang melihat judul yang menyesatkan (tidak memberikan konten yang dijanjikan judul) atau cerita dengan kualitas yang lebih rendah. Contohnya termasuk judul yang menyesatkan, membesar-besarkan cerita, atau terlalu mengejutkan atau emosional. Dikenal sebagai clickbait, konten ini dapat diberi peringkat lebih rendah berdasarkan perilaku pengguna yang menunjukkan ketidakpuasan melalui tindakan seperti tingkat bounce tinggi.
Pola tertentu meliputi:
- Judul yang melampaui penggoda, terutama dengan penggunaan kata keterangan yang berlebihan "ini" (misalnya, Jangan Pernah Minum Ini di Pesawat).
- Judul yang salah menggambarkan konten cerita aktual dan/atau impor, sehingga gagal memenuhi ekspektasi pembaca. Janji yang rusak dapat berupa menghilangkan aset (seperti video yang dirujuk dalam judul) atau tidak mengatasi informasi utama sama sekali.
Konten yang dapat menyebabkan ketidaknyamanan
Sebagai bagian dari upaya berkelanjutan kami untuk meningkatkan kualitas konten dan mempertahankan pengalaman positif bagi semua pengguna, MSN menerapkan standar yang lebih ketat pada konten yang mungkin dianggap ofensif, grafik, atau tidak pantas. Postingan mungkin tidak diprioritaskan atau dihapus jika judul, gambar, atau teks isi menyertakan materi yang mengganggu atau menyulitkan yang tidak memiliki relevansi editorial atau sosial yang lebih luas.
Contoh konten yang dapat memicu sinyal ini meliputi:
- Penggambaran mendetail tentang fungsi tubuh (misalnya, perut kembung, kotoran, buang air kecil, jerawat bermunculan)
- Penyakit menular seksual
- Pertemuan cabul (misalnya, pertemuan dengan pekerja seks, seks publik, ketelanjangan publik) di mana tidak ada relevansi sosial yang lebih luas seperti skandal politik.
- Cerita kriminal yang mencakup detail berlebihan (misalnya, spesifik dari tindakan seksual atau pembunuhan mengerikan) yang melampaui fakta-fakta kosong
- Cerita bertema titillating atau dewasa (misalnya, saran seksual eksplisit) tidak sesuai untuk audiens umum
- Konten yang mereferensikan penyimpangan seksual dan kesempurnaan
- Perilaku seksual hewan
- Dekompoisi grafis (misalnya daging yang dipenuhi dengan belatung)
Tipe konten ini dapat mengurangi kepercayaan pembaca dan sering dibenderai sebagai tidak pantas untuk distribusi luas.
Tergantung pada tingkat keparahan, konten berikut mungkin memiliki paparan terbatas atau dihapus, yang mengakibatkan penurunan kesan tingkat artikel:
- Gosip selebriti: Kami sekarang membatasi paparan konten selebriti yang berfokus pada (tetapi tidak terbatas pada) perkelahian selebriti, seksualisasi apa yang dikenakan selebriti, malfungsi lemari pakaian, aktivitas selebriti sehari-hari, masalah hubungan, dll. Konten ini masih akan muncul di halaman MSN, namun, hanya akan diekspos kepada pengguna yang mencari tipe konten ini.