Vytvoření přibližné shody (Power Query)

Při spojování sloupců v tabulce už nevyžadujete přesnou shodu. Přibližné porovnávání umožňuje porovnávat položky v samostatných seznamech a spojit je, pokud jsou podobné. Nastavením prahové hodnoty podobnosti můžete upravit toleranci shody.

Běžným případem použití přibližné shody jsou volná textová pole, například v průzkumu, kde odpovědi můžou obsahovat překlepy, jednotné nebo jednotné číslo, množné číslo, velká písmena, malá písmena a další varianty.

Hledání fuzzy je podporováno pouze u operací sloučení textových sloupců. Power Query používá Jaccardův algoritmus podobnosti k měření podobnosti mezi dvojicemi instancí.

Procedura:

  1. Pokud chcete otevřít dotaz, vyhledejte dotaz načtený dříve z Editor Power Query, vyberte buňku v datech a pak vyberte Upravit dotaz>. Další informace najdete v tématu Vytvoření, úprava a načtení dotazu v Excelu (Power Query).

  2. Vybrat Domů>Kombinování>Sloučení dotazů. Můžete taky vybrat možnost Sloučit dotazy jako nové. Zobrazí se dialogové okno Sloučit s primární tabulkou nahoře.

  3. Vyberte sloupec, který chcete použít pro přibližnou shodu. V tomto příkladu vybereme možnost Jméno.

  4. V rozevíracím seznamu vyberte sekundární tabulku a pak vyberte odpovídající sloupec přibližné shody. V tomto příkladu vybereme možnost Jméno.

  5. Vyberte druh spojení. Připojit se můžete několika různými způsoby. Vnější doleva je výchozí a nejběžnější. Další informace o jednotlivých typech spojení naleznete v tématu Sloučení dotazů.

  6. K provedení sloučení vyberte Použít fuzzy shodu, vyberte Možnosti fuzzy shody a pak vyberte jednu z následujících možností:

    • Prahová hodnota podobnosti Určuje, jak podobné musí být dvě hodnoty, aby se shodovaly. Minimální hodnota 0,00 způsobí, že se všechny hodnoty budou navzájem shodovat. Maximální hodnota 1,00 umožňuje pouze přesné shody. Výchozí hodnota je 0,80.
    • Ignorovat velká a malá písmena Určuje, jestli se mají textové hodnoty porovnávat s rozlišováním malých a velkých písmen nebo nerozlišováním malých a velkých písmen. Ve výchozím nastavení se nerozlišují malá a velká písmena, což znamená, že se malá a velká písmena ignorují.
    • Maximální počet shod Určuje maximální počet odpovídajících řádků, které budou vráceny pro každý vstupní řádek. Pokud například chcete pro každý vstupní řádek najít jen jeden odpovídající řádek, zadejte hodnotu 1. Ve výchozím nastavení se vrací všechny shody.
    • Transformační tabulka Zadejte jiný dotaz, který obsahuje tabulku mapování, aby se některé hodnoty mohly automaticky mapovat jako součást odpovídající logiky. Například definováním dvousloupcové tabulky s textovými sloupci "Od" a "Komu" s hodnotami "Microsoft" a "MSFT" budou tyto dvě hodnoty považovány za stejné (skóre podobnosti 1,00).
  7. Power Query analyzuje obě tabulky a zobrazí zprávu o tom, kolik shod udělala. V tomto příkladu výběr odpovídá 3 ze 4 řádků z první tabulky. Bez použití přibližné shody by se shodovaly pouze 2 ze 4 řádků.

  8. Pokud jste spokojení, vyberte OK. Pokud ne, vyzkoušejte různé možnosti sloučení fuzzy a přizpůsobte si prostředí.
    Možnosti fuzzy sloučení v Power Query

  9. Až budete spokojení, vyberte OK.

Viz také

Nápověda pro doplněk Power Query pro Excel

Sloučení dotazů (Power Query)

Sloučení fuzzy (docs.com)