テーブル列を結合するときに、完全一致は不要になります。 あいまい一致を使用すると、個別のリスト内の項目を比較し、類似している場合は結合できます。 類似性のしきい値を設定して、一致する許容範囲を調整できます。
あいまい一致の一般的なユース ケースは、自由形式のテキスト フィールドです。たとえば、回答に入力ミス、単数形、複数形、大文字、小文字、その他のバリエーションがある可能性があるアンケートなどです。
あいまい一致は、テキスト列に対するマージ操作でのみサポートされます。 Power Queryは、Jaccard 類似性アルゴリズムを使用して、インスタンスのペア間の類似性を測定します。
手順
-
クエリを開くには、Power Query エディターから以前に読み込まれたクエリを見つけ、データ内のセルを選択し、[クエリ ]> [編集] を選択します。 詳細については、「Excel でクエリを作成、編集、読み込む (Power Query)」を参照してください。
-
[ホーム ]> [ 結合 > マージ クエリ] を選択します。 [クエリのマージ] を [新規] として選択することもできます。 [マージ] ダイアログ ボックスが表示され、一番上にプライマリ テーブルが表示されます。
-
あいまい一致に使用する列を選択します。 この例では、[名] を選択します。
-
ドロップダウン リストからセカンダリ テーブルを選択し、対応するあいまい一致列を選択します。 この例では、[名] を選択します。
-
[結合の種類] を選択します。 参加するには、いくつかの方法があります。 Left Outer は既定値であり、最も一般的です。 各種類の結合の詳細については、「クエリのマージ」を参照してください。
-
[ あいまい一致を使用してマージを実行する] を選択し、[ あいまい一致オプション] を選択し 次のオプションから選択します。
-
類似性のしきい値 一致させるために、2 つの値の類似性を示します。 最小値が 0.00 の場合、すべての値が互いに一致します。 最大値 1.00 では、完全一致のみが許可されます。 既定値は 0.80 です。
-
大文字と小文字を区別しない テキスト値を大文字と小文字を区別するか、または区別しない方法で比較するかを示します。 既定の動作では大文字と小文字が区別されません。つまり、大文字と小文字は無視されます。
-
一致の最大数 入力行ごとに返される一致する行の最大数を制御します。 たとえば、入力行ごとに一致する行を 1 つだけ検索する場合は、値 1 を指定します。 既定の動作では、すべての一致が返されます。
-
変換テーブル 一部の値を照合ロジックの一部として自動マップできるように、マッピング テーブルを保持する別のクエリを指定します。 たとえば、"Microsoft" と "MSFT" の値を持つ "From" と "To" のテキスト列を持つ 2 列のテーブルを定義すると、これらの 2 つの値は同じと見なされます (類似性スコアは 1.00)。
-
-
Power Queryは両方のテーブルを分析し、一致した数に関するメッセージを表示します。 この例では、選択範囲は最初のテーブルの 4 行中 3 行に一致します。 あいまい一致を使用しないと、4 行のうち 2 行のみが一致します。
-
問題がなければ、[OK] を選択します。 そうでない場合は、さまざまなあいまいマージ オプション を試して、エクスペリエンスをカスタマイズしてください。
-
満足したら、[ OK] を選択します。