Når du joinforbinder tabelkolonner, behøver du ikke længere et nøjagtigt match. Fuzzy matching giver dig mulighed for at sammenligne elementer på separate lister og sammenføje dem, hvis de ligner hinanden. Du kan angive tærsklen for lighed for at justere den matchende tolerance.
En almindelig use case for fuzzy matching er med kombinationstekstfelter, f.eks. i en undersøgelse, hvor svar kan have slåfejl, ental, flertal, store bogstaver, små bogstaver og andre variationer.
Fuzzy matching understøttes kun ved flettehandlinger over tekstkolonner. Power Query bruger algoritmen jaccard-lighed til at måle ligheden mellem forekomstpar.
Procedure
-
Hvis du vil åbne en forespørgsel, skal du finde en, der tidligere er indlæst fra Power Query-editor, markere en celle i dataene og derefter vælge Forespørgsel > Rediger. Få mere at vide under Opret, rediger og indlæs en forespørgsel i Excel (Power Query).
-
Vælg Hjem > Kombiner > fletteforespørgsler. Du kan også vælge Flet forespørgsler som ny. Dialogboksen Flet vises med den primære tabel øverst.
-
Markér den kolonne, du vil bruge til dit slørede match. I dette eksempel vælger vi Fornavn.
-
Vælg den sekundære tabel på rullelisten, og vælg derefter den tilsvarende kolonne med slørede match. I dette eksempel vælger vi Fornavn.
-
Vælg en Join Kind. Der er flere forskellige måder at deltage på. Left Outer er standard og den mest almindelige. Du kan få mere at vide om hver type joinforbindelse under Flette forespørgsler.
-
Vælg Brug fuzzy matching for at udføre fletningen, vælg Fuzzy-indstillinger, og vælg derefter mellem følgende indstillinger:
-
Grænseværdi for lighed Angiver, hvor ens to værdier skal være for at matche. Den mindste værdi på 0,00 medfører, at alle værdier matcher hinanden. Den maksimale værdi på 1,00 tillader kun nøjagtige matches. Standardværdien er 0,80.
-
Ignorer store og små bogstaver Angiver, om tekstværdier skal sammenlignes med forskel på store og små bogstaver eller ufølsomme. Standardfunktionsmåden skelner ikke mellem store og små bogstaver, hvilket betyder, at store og små bogstaver ignoreres.
-
Maksimalt antal forekomster Styrer det maksimale antal matchende rækker, der returneres for hver inputrække. Hvis du f.eks. kun vil finde én tilsvarende række for hver inputrække, skal du angive værdien 1. Standardfunktionsmåden er at returnere alle forekomster.
-
Transformationstabel Angiv en anden forespørgsel, der indeholder en tilknytningstabel, så nogle værdier kan tilknyttes automatisk som en del af den matchende logik. Hvis du f.eks. definerer en tabel med to kolonner med tekstkolonnerne "Fra" og "Til" med værdierne "Microsoft" og "MSFT", betragtes disse to værdier som ens (lighedsscore på 1,00).
-
-
Power Query analyserer begge tabeller og viser en meddelelse om, hvor mange match det har lavet. I eksemplet svarer markeringen til 3 af 4 rækker fra den første tabel. Uden at bruge fuzzy matchende, ville kun 2 af 4 rækker matche.
-
Hvis du er tilfreds, skal du vælge OK. Hvis ikke, kan du prøve forskellige fuzzy-fletningsindstillinger for at tilpasse din oplevelse.
-
Når du er tilfreds, skal du vælge OK.
Se også
Hjælp til Power Query til Excel