테이블 열을 조인할 때 더 이상 정확한 일치 항목이 필요하지 않습니다. 유사 항목 일치를 사용하면 별도의 목록의 항목을 비교하고 비슷한 경우 조인할 수 있습니다. 유사성 임계값을 설정하여 일치 허용 오차를 조정할 수 있습니다.
유사 항목 일치에 대한 일반적인 사용 사례는 응답에 오타, 단수, 복수형, 대문자, 소문자 및 기타 변형이 있을 수 있는 설문 조사와 같은 자유형 텍스트 필드와 같습니다.
유사 항목 일치는 텍스트 열에 대한 병합 작업에서만 지원됩니다. Power Query Jaccard 유사성 알고리즘을 사용하여 인스턴스 쌍 간의 유사성을 측정합니다.
절차
-
쿼리를 열려면 Power Query 편집기 이전에 로드한 쿼리를 찾고 데이터에서 셀을 선택한 다음 쿼리 > 편집을 선택합니다. 자세한 내용은 Excel에서 쿼리 만들기, 편집 및 로드(Power Query)를 참조하세요.
-
홈 > 결합 > 병합 쿼리를 선택합니다. 쿼리 병합을 새로 만들기로 선택할 수도 있습니다. 병합 대화 상자가 맨 위에 기본 테이블과 함께 표시됩니다.
-
유사 항목 일치에 사용할 열을 선택합니다. 이 예제에서는 이름을 선택합니다.
-
드롭다운 목록에서 보조 테이블을 선택한 다음 해당 유사 항목 일치 열을 선택합니다. 이 예제에서는 이름을 선택합니다.
-
조인 종류를 선택합니다. 조인하는 방법에는 여러 가지가 있습니다. Left Outer 는 기본값이며 가장 일반적입니다. 각 조인 종류에 대한 자세한 내용은 쿼리 병합을 참조하세요.
-
유사 항목 일치 사용을 선택하여 병합을 수행하고 유사 항목 일치 옵션을 선택한 다음, 다음 옵션 중에서 선택합니다.
-
유사성 임계값 일치시키기 위해 두 값이 얼마나 유사한지 나타냅니다. 최소값이 0.00이면 모든 값이 서로 일치합니다. 최대값 1.00은 정확한 일치만 허용합니다. 기본값은 0.80입니다.
-
대/소문자 무시 대/소문자를 구분하거나 구분하지 않는 방식으로 텍스트 값을 비교해야 하는지 여부를 나타냅니다. 기본 동작은 대/소문자를 구분하지 않습니다. 즉, 대/소문자를 무시합니다.
-
최대 일치 항목 수 각 입력 행에 대해 반환될 일치하는 행의 최대 수를 제어합니다. 예를 들어 각 입력 행에 대해 일치하는 행을 하나만 찾으려면 값을 1로 지정합니다. 기본 동작은 모든 일치 항목을 반환하는 것입니다.
-
변환 테이블 매핑 테이블을 포함하는 다른 쿼리를 지정하여 일치하는 논리의 일부로 일부 값을 자동으로 매핑할 수 있도록 합니다. 예를 들어 값이 "Microsoft" 및 "MSFT"인 "From" 및 "To" 텍스트 열로 2열 테이블을 정의하면 이러한 두 값이 동일하게 간주됩니다(유사성 점수 1.00).
-
-
Power Query 두 테이블을 분석하고 일치하는 항목 수에 대한 메시지를 표시합니다. 이 예제에서 선택 영역은 첫 번째 테이블의 4개 행 중 3개와 일치합니다. 유사 항목 일치를 사용하지 않으면 4개 행 중 2개만 일치합니다.
-
만족하는 경우 확인을 선택합니다. 그렇지 않은 경우 다른 유사 항목 병합 옵션을 시도하여 환경을 사용자 지정합니다.
-
만족하면 확인을 선택합니다.