MSN이 콘텐츠의 순위를 지정하는 방법
MSN은 전 세계 수천 명의 게시자의 뉴스 기사, 사진 갤러리 및 비디오를 게시하고 Microsoft Edge, Microsoft Windows, MSN.com 및 MSN 모바일 앱을 비롯한 Microsoft 제품 전반에서 이 콘텐츠를 홍보합니다.
소비자가 MSN 피드를 볼 때마다 최신 개인 설정된 콘텐츠로 새로 고칩니다. 다양한 신호에 따라 알고리즘은 편집 감독을 통해 피드에서 콘텐츠를 선택하고 정렬합니다. 이 순위 콘텐츠 시스템은 참여 및 정보를 제공하고 각 사용자에게 가장 관련성이 높은 스토리를 선택하는 동시에 콘텐츠가 시기적시, 뉴스가치가 높고, 고품질이며, 직장과 가정에서 안전하도록 설계되었습니다.
이러한 매개 변수의 상대적 중요도는 사용자가 뉴스 피드를 볼 때마다 달라질 수 있습니다. 알고리즘은 신호를 지속적으로 식별하고 개선하고 새로운 기능을 실험하면서 항상 진화하고 있습니다.
이 문서의 내용
사용자 관련성
Microsoft는 모든 소비자에게 개인 설정된 뉴스 피드를 제공하여 각 사용자의 고유한 관심사 및 콘텐츠에 대한 기본 설정을 충족합니다. 이 개인 설정의 핵심은 문서 이해와 사용자 기본 설정을 일치시키는 알고리즘입니다. 이러한 알고리즘은 각 사용자에 대해 가장 관련성이 높은 콘텐츠를 선택하도록 설계되었습니다.
사용자의 기본 설정은 다음 두 가지 방법을 통해 시스템에서 시간이 지남에 따라 학습됩니다.
- 명시적 개인 설정. 알고리즘은 사용자가 특정 topics 팔로우, 특정 콘텐츠 좋아하거나 싫어하거나 게시자 기본 설정을 나타내는 등의 작업을 포함하여 설정을 수동으로 구성하는 방법을 존중합니다.
- 암시적 개인 설정. 사용자의 개인 정보 설정에 따라 사용자가 콘텐츠를 읽고 Microsoft 제품에 참여함에 따라 스토리는 사용자의 기본 설정을 더 잘 이해하기 위해 패턴을 분석합니다. 알고리즘은 각 사용자에 대한 장기 및 단기 패턴을 모두 찾으며, 콘텐츠 관심사는 단기적으로 다를 수 있지만 장기적인 경향은 다를 수 있음을 인정합니다. ( 여기에서 Microsoft 개인 정보에 대해 자세히 알아보세요.)
기계 학습 알고리즘은 단순히 'topics'을 인식하는 것 이상의 깊은 문서 이해를 유도합니다. 시스템은 각 문서에 대한 분석을 수행하여 텍스트 및 메타데이터를 기반으로 인사이트를 얻고 콘텐츠를 수학 모델로 변환합니다.
사용자 기본 설정 및 문서 이해라는 두 가지 수학 모델은 각 사용자에게 가장 일치하는 콘텐츠 선택과 비교할 수 있습니다.
알고리즘은 각 사용자와 콘텐츠를 직접 일치시키는 것 외에도 비슷한 기본 설정으로 사용자를 참여시키는 콘텐츠를 검색합니다.
서식 지정
누락된 헤더 요소, 누락된 목록, 누락된 URL 또는 사용자 환경이 좋지 않은 관련 없는 단어/구와 같은 시각적 결함이 없는 피드의 품질 콘텐츠를 승격하려고 합니다. 콘텐츠에 제한된 노출이 표시되지 않도록 하려면 다음을 비롯한 게시 지침을 따르고 있는지 확인합니다.
서식 없는 텍스트의 긴 블록
형식이 지정되지 않은 텍스트와 같이 품질이 높고 결함이 없는 콘텐츠는 피드에서 가시성을 얻을 확률이 높습니다. 업로드할 때 적절한 문장과 단락 구조와 코딩이 있는지 확인합니다. 줄 바꿈이나 단락 나누기를 사용하지 않는 아티클은 피드에서 승격되지 않습니다.
서식이 지정된 텍스트의 예: <p>단락입니다.</p> (여는 코드 및 닫는 코드를 기록해 둡니다.)
원본 문서 링크
원래 문서에 대한 링크는 아티클의 맨 아래에만 표시할 수 있습니다. 텍스트의 본문 내에서 원본으로 다시 연결되는 게시물의 도달 범위는 제한됩니다.
일반 텍스트 URL
콘텐츠에 링크가 있는 경우 해당 링크의 서식이 적절하게 지정되었는지 확인해야 합니다. instance 경우 콘텐츠의 링크가 다음과 같이 표시되는 경우 https://www.conotoso.com/r/linden-new-york 콘텐츠의 형식이 올바르게 지정되지 않으며 노출이 제한되거나 그에 따라 제거될 수 있습니다.
유효한 날짜 형식
콘텐츠가 소비자와 관련이 있는지 확인하려면 표시되는 문서가 정확하게 날짜가 지정되었는지 확인해야 합니다. 날짜는 RFC 3339 또는 RFC 822 날짜 형식을 사용하여 표현해야 합니다.
유효한 날짜 형식 예제:
- 수, 04 10월 2017 15:00:00 +0200
- 2017-10-04T13:00:00+00:00
CTR(클릭 속도)
클릭 횟수를 노출 수로 나눈 CTR(클릭률)은 콘텐츠 순위를 결정하는 데 사용되는 참여도의 한 척도입니다. CTR은 주로 제목/헤드라인, 이미지 및 추상을 포함하여 링크를 승격할 때 표시되는 콘텐츠 요소의 영향을 받습니다. 기계 학습은 각 콘텐츠의 CTR 잠재력을 판단합니다.
CTR이 높은 콘텐츠는 일반적으로 좋지만 CTR이 높을 수 있지만 읽기 권한자(clickbait)로부터 불만을 생성하는 콘텐츠 범주도 있습니다. 아래의 부정적인 신호에 대한 섹션에서 자세히 알아보세요.
새로 고침 및 타임라인
뉴스 피드의 콘텐츠는 "신선하고 시기 적절하게" 될 것으로 예상됩니다. 따라서 최신 콘텐츠의 순위는 평균적으로 이전 콘텐츠보다 높습니다. 뉴스, 금융 또는 스포츠 이야기의 최신은 이러한 수직이 빠르게 나이 이야기를하는 경향이 있기 때문에 중요하다. 알고리즘은 다른 topics 더 많은 상록수 경향이 있음을 인식하고 이 콘텐츠가 더 오래되도록 허용하여 이를 인식합니다. 게시 날짜가 정확하지 않은 콘텐츠의 순위는 더 낮을 수 있습니다.
추세 및 뉴스 가치
평균적으로 추세 topics, 속보 및 헤드 라인 뉴스에 대한 이야기는 더 높은 순위가 매겨집니다. 피드의 상위 위치는 종종 오늘의 주요 뉴스가치가 있는 뉴스를 위해 예약됩니다.
추세는 공용 및 독점 모두의 여러 외부 데이터 원본을 모니터링하여 관찰됩니다. 이 시스템은 인터넷에서 유행하는 것뿐만 아니라 Microsoft 캔버스 및 Bing 검색의 추세도 모니터링합니다. 이러한 신호는 결합되고 평균화되어 각 콘텐츠 항목의 추세 가능성을 평가합니다. 더 많은 잠재력을 가진 항목은 피드에서 더 높은 순위가 지정됩니다.
브랜드 기관
잘 알려진 국내 또는 글로벌 뉴스 게시자의 이야기는 소비자와 게시자 모두 더 권위 있고 신뢰할 수있는 것으로 간주하기 때문에 무거운 무게를 가지고 있습니다. 그러나 현지 또는 덜 잘 알려진 브랜드의 이야기는 개인 설정된 피드의 중요한 구성 요소이기도 하며 종종 다른 신호로 인해 높은 순위가 매겨집니다.
알고리즘은 아직 주제별로 권위를 고려하지 않습니다. 예를 들어 일부 게시자는 스포츠 분야에서 더 권위있는 반면 다른 퍼블리셔는 정치를 전문으로합니다. 이는 Microsoft가 향후 순위 업데이트에서 개선할 것으로 예상되는 영역입니다.
음수 신호 및 clickbait
일부 콘텐츠는 클릭을 생성하지만, 헤드라인이 오해의 소지가 있다고 인식하는 사용자(헤드라인이 약속한 콘텐츠를 제공하지 않음) 또는 낮은 품질의 이야기에 대한 불만을 생성합니다. 예를 들어 오해의 소지가 있거나, 이야기를 과장하거나, 지나치게 충격적이거나 감정적인 헤드라인이 있습니다. 일반적으로 clickbait로 알려진 이 콘텐츠는 높은 반송률과 같은 작업을 통해 불만을 나타내는 사용자 동작에 따라 순위가 낮아질 수 있습니다.
특정 패턴은 다음과 같습니다.
- 특히 부사 "this"의 남용과 함께 티저를 넘어 헤드 라인 (예 : 비행기에서 이것을 마시지 마십시오).
- 실제 스토리 콘텐츠 및/또는 가져오기를 잘못 표현하여 독자의 기대를 충족시키지 못하는 헤드라인입니다. 깨진 약속은 자산 생략(예: 헤드라인에 참조된 비디오)을 생략하거나 주요 정보를 전혀 다루지 않는 것까지 다양할 수 있습니다.
불편함을 유발할 수 있는 콘텐츠
MSN은 콘텐츠 품질을 개선하고 모든 사용자에게 긍정적인 환경을 유지하기 위한 지속적인 노력의 일환으로 공격적이거나 그래픽적이거나 부적절한 것으로 인식될 수 있는 콘텐츠에 더 엄격한 표준을 적용합니다. 헤드라인, 이미지 또는 본문 텍스트에 광범위한 편집 또는 사회적 관련성이 결여된 불안하거나 자극적인 자료가 포함된 경우 게시물의 순위를 낮추거나 제거할 수 있습니다.
이러한 신호를 트리거할 수 있는 콘텐츠의 예는 다음과 같습니다.
- 신체 기능의 자세한 묘사 (예: 자만심, 배설물, 배뇨, 여드름 터지는)
- 성병
- 음란 한 만남 (예 : 성노동자와의 만남, 공공 섹스, 공공 누드) 정치 스캔들과 같은 광범위한 사회적 관련성이없는 경우.
- 과도한 세부 사항을 포함하는 범죄 이야기 (instance, 성적 행위 또는 끔찍한 살인의 세부 사항) 이는 맨 사실을 넘어
- 일반 관객에게 적합하지 않은 자극적이거나 성인을 테마로 한 이야기(예: 노골적인 성적 조언)
- 성적 편차 및 수간을 참조하는 콘텐츠
- 동물의 성적 행동
- 그래픽 분해(예: 구더기가 득실거리는 고기)
이러한 유형의 콘텐츠는 읽기 권한자 신뢰를 줄일 수 있으며 광범위한 배포에 적합하지 않은 것으로 플래그가 지정되는 경우가 많습니다.
심각도에 따라 다음 콘텐츠는 노출이 제한되거나 그에 따라 제거되어 문서 수준 노출이 감소할 수 있습니다.
- 연예인 험담: 우리는 이제 유명 인사 싸움에 초점을 맞춘 유명 인사 콘텐츠의 노출을 제한하고 있습니다 (하지만 이에 국한되지 않음) 유명 인사가 입고있는 것을 성적, 옷장 오작동, 일상적인 유명 인사 활동, 관계 문제 등. 이 콘텐츠는 MSN 페이지에 계속 표시되지만 이러한 유형의 콘텐츠를 찾는 사용자에게만 노출됩니다.