當你連接表格欄位時,就不再需要完全匹配。 模糊匹配讓你比較不同清單中的項目,如果相似就合併。 你可以設定相似 度閾 值來調整匹配的容差。
模糊匹配的常見應用場景是自由文字欄位,例如調查中回覆可能有錯字、單數、複數、大寫、小寫及其他變體。
模糊匹配僅支援於文字欄位合併操作。 Power Query 使用 Jaccard 相似度演算法來衡量實例對之間的相似度。
程序
要開啟查詢,請先找到先前從 Power Query 編輯器載入的查詢,選取資料中的一個儲存格,然後選擇查詢>編輯。 更多資訊請參閱「在 Excel 中建立、編輯及載入查詢」 (Power Query) 。
選擇主場>聯合體>合併查詢。 您也可以選擇「 合併查詢為新」。 合併對話框會出現,主表格位於頂端。
選擇你想用來做模糊比對的欄位。 在這個範例中,我們選擇 First Name。
從下拉選單中選擇次要表格,然後選擇對應的模糊比對欄位。 在這個範例中,我們選擇 First Name。
選擇 一種連接類型。 有幾種不同的加入方式。 左外是 預設且最常見的。 欲了解更多關於每種連接方式的資訊,請參閱 合併查詢。
選擇 使用模糊匹配來執行合併,選擇模糊 匹配選項,然後從以下選項中選擇:
- 相似閾值 表示兩個數值需要多接近才能匹配。 最小值為0.00會使所有值彼此匹配。 最大值 1.00 只允許完全匹配。 預設值為 0.80。
- 忽略大案例 指示文字值應以大小寫區分或不區分方式比較。 預設行為是不區分大小寫,意即忽略大小寫。
- 最多比賽場數 控制每個輸入列回傳的最大匹配列數。 例如,如果你只想為每個輸入列找到一列匹配的列,則指定一個值為 1。 預設行為是回傳所有配對。
- 轉換表 指定另一個查詢,包含映射表,讓部分值能作為匹配邏輯的一部分自動映射。 例如,定義一個兩欄表格,包含「From」和「To」文字欄位,值為「Microsoft」和「MSFT」,這兩個值會被視為相同的 (相似度分數 1.00) 。
Power Query 會分析這兩個資料表,並顯示它匹配了多少訊息。 在範例中,選擇匹配了第一張表格中4行中的3行。 若不使用模糊匹配,4 列中只有 2 列會匹配。
如果你滿意,請選擇 確定。 如果沒有,試試不同的 模糊合併選項 來自訂你的體驗。
滿意後,選擇 確定。