Kada spajate stupce tablice, više vam nije potrebno točno podudaranje. Čupavo podudaranje omogućuje vam usporedbu stavki na zasebnim popisima i pridruživanje njima ako su slične. Prag sličnosti možete postaviti da biste prilagodili odgovarajuće dopušteno odstupanje.
Fuzzy podudarni slučaj obično se koristi s tekstnim poljima prostoručnog oblikovanja, primjerice u anketi u kojoj odgovori mogu sadržavati pogreške u pisanju, singularnosti, množine, velika slova, mala slova i druge varijacije.
Čupavo podudaranje podržano je samo u operacijama spajanja preko tekstnih stupaca. Power Query koristi algoritam sličnosti jaccard za mjerenje sličnosti između parova instanci.
Procedura
-
Da biste otvorili upit, pronađite prethodno učitan iz uređivač dodatka Power Query, odaberite ćeliju u podacima, a zatim Upit> Uređivanje. Dodatne informacije potražite u članku Stvaranje, uređivanje i učitavanje upita u programu Excel (Power Query).
-
Odaberite Polazno > Kombiniranje > spojenih upita. Možete i odabrati Spoji upite kao novo. Pojavit će se dijaloški okvir Spajanje s primarnom tablicom pri vrhu.
-
Odaberite stupac koji želite koristiti za mutno podudaranje. U ovom primjeru odabiremo Ime.
-
Na padajućem popisu odaberite sekundarnu tablicu, a zatim odaberite odgovarajući stupac s mutnim podudaranjem. U ovom primjeru odabiremo Ime.
-
Odaberite Vrstu spoja. Postoji nekoliko različitih načina za pridruživanje. Lijevi vanjski zadani je i najčešći. Dodatne informacije o svakoj vrsti spoja potražite u članku Spajanje upita.
-
Odaberite Koristi čupavo podudaranje da biste pokrenuli spajanje, odaberite Čupave mogućnosti podudaranja, a zatim odaberite neku od sljedećih mogućnosti:
-
Prag sličnosti Označava koliko su slične dvije vrijednosti potrebne da bi se podudarali. Minimalna vrijednost od 0,00 uzrokuje međusobno podudaranje svih vrijednosti. Maksimalna vrijednost od 1,00 dopušta samo točna podudaranja. Zadana je vrijednost 0,80.
-
Zanemari velika i mala slova Označava treba li tekstne vrijednosti uspoređivati na način koji razlikuje velika i mala slova ili ne razlikuje velika i mala slova. Zadano je ponašanje neosjetljivo na velika i mala slova, što znači da se velika i mala slova zanemaruju.
-
Maksimalan broj podudaranja Određuje maksimalan broj podudarnih redaka koji će se vratiti za svaki redak unosa. Ako, primjerice, želite pronaći samo jedan podudarni redak za svaki redak unosa, navedite vrijednost 1. Zadano je ponašanje vraćanje svih podudaranja.
-
Transformacijska tablica Navedite drugi upit koji sadrži tablicu mapiranja da bi se neke vrijednosti automatski mapirane kao dio odgovarajuće logike. Definiranjem tablice s dva stupca s tekstnim stupcima "Pošiljatelj" i "Prima" s vrijednostima "Microsoft" i "MSFT" te će se dvije vrijednosti smatrati jednakima (rezultat sličnosti 1,00).
-
-
Power Query analizira obje tablice i prikazuje poruku o tome koliko je podudaranja napravljeno. U primjeru se odabir podudara s 3 od 4 retka iz prve tablice. Bez korištenja mutnog podudaranja, podudaraju se samo dva od 4 retka.
-
Ako ste zadovoljni, odaberite U redu. Ako nije, isprobajte različite mogućnosti fuzzy spajanja da biste prilagodili svoje iskustvo.
-
Kada ste zadovoljni, odaberite U redu.