Quando associa colunas de tabela, já não precisa de uma correspondência exata. A correspondência difusa permite-lhe comparar itens em listas separadas e associá-los se forem semelhantes. Pode definir o Limiar de Semelhança para ajustar a tolerância correspondente.
Um caso de utilização comum para correspondência difusa é com campos de texto de forma livre, como num inquérito em que as respostas podem ter erros de digitação, singulares, plural, maiúsculas, minúsculas e outras variações.
A correspondência difusa só é suportada em operações de intercalação em colunas de texto. Power Query utiliza o algoritmo de semelhança Jaccard para medir a semelhança entre pares de instâncias.
Procedimento
-
Para abrir uma consulta, localize uma que foi carregada anteriormente a partir do Editor do Power Query, selecione uma célula nos dados e, em seguida, selecione Consulta > Editar. Para obter mais informações, consulte Criar, editar e carregar uma consulta no Excel (Power Query).
-
Selecione Base > Combinar > Intercalar Consultas. Também pode selecionar Intercalar Consultas como Novas. A caixa de diálogo Intercalar é apresentada com a tabela primária na parte superior.
-
Selecione a coluna que pretende utilizar para a sua correspondência difusa. Neste exemplo, selecionamos Nome Próprio.
-
Na lista pendente, selecione a tabela secundária e, em seguida, selecione a coluna correspondente de correspondência difusa. Neste exemplo, selecionamos Nome Próprio.
-
Selecione um Tipo de Associação. Existem várias formas diferentes de associação. Left Outer é a predefinição e a mais comum. Para obter mais informações sobre cada tipo de associação, veja Intercalar consultas.
-
Selecione Utilizar correspondência difusa para executar a intercalação, selecione Opções de correspondência difusas e , em seguida, selecione uma das seguintes opções:
-
Limiar de Semelhança Indica o quão semelhantes dois valores têm de ser para corresponder. O valor mínimo de 0,00 faz com que todos os valores correspondam entre si. O valor máximo de 1,00 só permite correspondências exatas. O valor predefinido é 0,80.
-
Ignorar maiúsculas/minúscula Indica se os valores de texto devem ser comparados de forma sensível a maiúsculas e minúsculas ou não. O comportamento predefinido não é sensível a maiúsculas e minúsculas, o que significa que o caso é ignorado.
-
Número máximo de correspondências Controla o número máximo de linhas correspondentes que serão devolvidas para cada linha de entrada. Por exemplo, se apenas quiser encontrar uma linha correspondente para cada linha de entrada, especifique um valor de 1. O comportamento predefinido é devolver todas as correspondências.
-
Tabela de transformação Especifique outra consulta que contenha uma tabela de mapeamento, para que alguns valores possam ser mapeados automaticamente como parte da lógica correspondente. Por exemplo, definir uma tabela de duas colunas com colunas de texto "De" e "Para" com os valores "Microsoft" e "MSFT" fará com que estes dois valores sejam considerados iguais (classificação de semelhança de 1,00).
-
-
Power Query analisa ambas as tabelas e apresenta uma mensagem sobre quantas correspondências efetuou. No exemplo, a seleção corresponde a 3 de 4 linhas da primeira tabela. Sem utilizar correspondência difusa, apenas 2 de 4 linhas corresponderiam.
-
Se estiver satisfeito, selecione OK. Caso contrário, experimente diferentes opções de intercalação Difusa para personalizar a sua experiência.
-
Quando estiver satisfeito, selecione OK.
Consulte Também
Ajuda do Power Query para Excel