Wenn Sie Tabellenspalten verbinden, benötigen Sie keine exakte Übereinstimmung mehr. Mit dem Fuzzyabgleich können Sie Elemente in separaten Listen vergleichen und sie verbinden, wenn sie ähnlich sind. Sie können den Ähnlichkeitsschwellenwert festlegen, um die übereinstimmende Toleranz anzupassen.
Ein gängiger Anwendungsfall für Fuzzyabgleiche ist die Verwendung von Freiformtextfeldern, z. B. in einer Umfrage, bei der Antworten Tippfehler, Singulars, Plurals, Großbuchstaben, Kleinbuchstaben und andere Variationen aufweisen können.
Der Fuzzyabgleich wird nur bei Zusammenführungsvorgängen über Textspalten unterstützt. Power Query verwendet den Jaccard-Ähnlichkeitsalgorithmus, um die Ähnlichkeit zwischen Instanzenpaaren zu messen.
Vorgehensweise
-
Suchen Sie zum Öffnen einer Abfrage, die zuvor aus dem Power Query-Editor geladen wurde, wählen Sie eine Zelle in den Daten aus, und wählen Sie dann Abfrage > Bearbeiten aus. Weitere Informationen finden Sie unter Erstellen, Bearbeiten und Laden einer Abfrage in Excel (Power Query).
-
Wählen Sie Start > Kombinieren > Zusammenführen von Abfragen aus. Sie können auch Abfragen zusammenführen als Neu auswählen. Das Dialogfeld Zusammenführen wird mit der primären Tabelle oben angezeigt.
-
Wählen Sie die Spalte aus, die Sie für Ihre Fuzzy-Übereinstimmung verwenden möchten. In diesem Beispiel wählen wir Vorname aus.
-
Wählen Sie in der Dropdownliste die sekundäre Tabelle und dann die entsprechende Fuzzy-Übereinstimmungsspalte aus. In diesem Beispiel wählen wir Vorname aus.
-
Wählen Sie eine Joinart aus. Es gibt verschiedene Möglichkeiten zum Beitreten. Left Outer ist die Standardeinstellung und die am häufigsten verwendete. Weitere Informationen zu jeder Art von Join finden Sie unter Mergeabfragen.
-
Wählen Sie Fuzzyabgleich verwenden aus, um die Zusammenführung durchzuführen, wählen Sie Fuzzyabgleichsoptionen aus, und wählen Sie dann eine der folgenden Optionen aus:
-
Ähnlichkeitsschwellenwert Gibt an, wie ähnlich zwei Werte sein müssen, um übereinstimmen zu können. Der Mindestwert von 0,00 bewirkt, dass alle Werte übereinstimmen. Der Maximalwert von 1,00 lässt nur genaue Übereinstimmungen zu. Der Standardwert ist 0,80.
-
Groß-/Kleinschreibung ignorieren Gibt an, ob Textwerte unter Beachtung der Groß-/Kleinschreibung oder nicht beachtet werden sollen. Beim Standardverhalten wird die Groß-/Kleinschreibung nicht beachtet, d. h. die Groß-/Kleinschreibung wird ignoriert.
-
Maximale Anzahl von Übereinstimmungen Steuert die maximale Anzahl übereinstimmender Zeilen, die für jede Eingabezeile zurückgegeben werden. Wenn Sie beispielsweise nur eine übereinstimmende Zeile für jede Eingabezeile finden möchten, geben Sie den Wert 1 an. Das Standardverhalten besteht darin, alle Übereinstimmungen zurückzugeben.
-
Transformationstabelle Geben Sie eine weitere Abfrage an, die eine Zuordnungstabelle enthält, damit einige Werte automatisch als Teil der übereinstimmenden Logik zugeordnet werden können. Wenn Sie beispielsweise eine zweispaltige Tabelle mit den Textspalten "From" und "To" mit den Werten "Microsoft" und "MSFT" definieren, werden diese beiden Werte als gleich angesehen (Ähnlichkeitsbewertung von 1,00).
-
-
Power Query analysiert beide Tabellen und zeigt eine Meldung an, wie viele Übereinstimmungen erzielt wurden. Im Beispiel entspricht die Auswahl 3 von vier Zeilen aus der ersten Tabelle. Ohne Fuzzyabgleich würden nur 2 von vier Zeilen übereinstimmen.
-
Wenn Sie zufrieden sind, wählen Sie OK aus. Wenn dies nicht der Fehler ist, probieren Sie verschiedene Fuzzyzusammenführungsoptionen aus, um Ihre Erfahrung anzupassen.
-
Wenn Sie zufrieden sind, wählen Sie OK aus.
Siehe auch
Hilfe zu Power Query für Excel