При соединении столбцов таблицы точное совпадение больше не требуется. Нечеткое сопоставление позволяет сравнивать элементы в отдельных списках и объединять их, если они похожи. Вы можете задать порог подобия, чтобы настроить допустимость сопоставления.
Распространенный вариант использования для нечеткого сопоставления — это поля текста свободной формы, например в опросе, где ответы могут содержать опечатки, сингулярные числа, во множественном числе, прописные буквы, строчные буквы и другие варианты.
Нечеткое сопоставление поддерживается только при операциях слияния над текстовыми столбцами. Power Query использует алгоритм подобия Jaccard для измерения сходства между парами экземпляров.
Последовательность действий
-
Чтобы открыть запрос, найдите ранее загруженный из Редактор Power Query, выберите ячейку в данных, а затем выберите Запрос > Изменить. Дополнительные сведения см. в статье Создание, изменение и загрузка запроса в Excel (Power Query).
-
Выберите Главная > объединитьзапросы > слияния. Вы также можете выбрать команду Объединить запросы как Создать. Откроется диалоговое окно Слияние с основной таблицей в верхней части.
-
Выберите столбец, который вы хотите использовать для нечеткого совпадения. В этом примере мы выбираем Имя.
-
В раскрывающемся списке выберите вторичную таблицу, а затем выберите соответствующий столбец нечеткого соответствия. В этом примере мы выбираем Имя.
-
Выберите тип соединения. Существует несколько разных способов присоединения. Left Outer — это значение по умолчанию и наиболее распространенное. Дополнительные сведения о каждом типе соединения см. в разделе Запросы слияния.
-
Выберите Использовать нечеткое сопоставление для выполнения слияния, выберите параметры нечеткого сопоставления, а затем выберите один из следующих вариантов:
-
Порог сходства Указывает, насколько похожими должны быть два значения для сопоставления. Минимальное значение 0,00 приводит к тому, что все значения будут совпадать друг с другом. Максимальное значение 1,00 допускает только точные совпадения. Значение по умолчанию — 0,80.
-
Пропустить регистр Указывает, следует ли сравнивать текстовые значения с учетом регистра или без учета регистра. Поведение по умолчанию не учитывает регистр, что означает, что регистр игнорируется.
-
Максимальное количество совпадений Управляет максимальным числом соответствующих строк, которые будут возвращены для каждой входной строки. Например, если требуется найти только одну соответствующую строку для каждой входной строки, укажите значение 1. По умолчанию возвращаются все совпадения.
-
Таблица преобразования Укажите другой запрос, содержащий таблицу сопоставления, чтобы некоторые значения можно было автоматически сопоставить как часть логики сопоставления. Например, при определении таблицы с двумя столбцами с текстовыми столбцами "From" и "To" со значениями "Microsoft" и "MSFT" эти два значения будут считаться одинаковыми (оценка подобия 1,00).
-
-
Power Query анализирует обе таблицы и отображает сообщение о количестве выполненных совпадений. В примере выделение соответствует 3 из 4 строк из первой таблицы. Без использования нечеткого сопоставления будут соответствовать только 2 из 4 строк.
-
Если вы удовлетворены, нажмите кнопку ОК. Если нет, попробуйте использовать разные параметры нечеткого слияния , чтобы настроить интерфейс.
-
Если это будет выполнено, нажмите кнопку ОК.
См. также
Справка по Power Query для Excel