בעת צירוף עמודות טבלה, אינך זקוק עוד להתאמה מדויקת. התאמה מטושטשת מאפשרת לך להשוות פריטים ברשימות נפרדות ולהצטרף אליהם אם הם דומים. באפשרותך להגדיר את סף הדמיון כדי להתאים את הסובלנות התואמת.
מקרה שימוש נפוץ להתאמה מטושטשת הוא עם שדות טקסט בצורה חופשית, כגון בסקר שבו תשובות עשויות לכלול שגיאות הקלדה, יחידים, צורת רבים, אותיות רישיות, אותיות קטנות וריאציות אחרות.
התאמה מטושטשת נתמכת רק בפעולות מיזוג על-פני עמודות טקסט. Power Query באלגוריתם הדמיון של Jaccard כדי למדוד את הדמיון בין זוגות מופעים.
הליך
-
כדי לפתוח שאילתה, אתר שאילתה שנטען בעבר עורך Power Query, בחר תא בנתונים ולאחר מכן בחר שאילתה > ערוך. לקבלת מידע נוסף, ראה יצירה, עריכה וטעינה של שאילתה ב- Excel (Power Query).
-
בחר בית > שאילתות > מיזוג נתונים. באפשרותך גם לבחור מיזוג שאילתות כחדש. תיבת הדו-שיח מיזוג מופיעה עם הטבלה הראשית בחלק העליון.
-
בחר את העמודה שבה ברצונך להשתמש להתאמה מטושטשת. בדוגמה זו, אנו בוחרים בשם פרטי.
-
מהרשימה הנפתחת, בחר את הטבלה המשני ולאחר מכן בחר את העמודה המתאימה להתאמה מטושטשת. בדוגמה זו, אנו בוחרים בשם פרטי.
-
בחר סוג הצטרפות. קיימות כמה דרכים שונות להצטרף. Left Outer היא ברירת המחדל והנפוצה ביותר. לקבלת מידע נוסף אודות כל סוג של צירוף, ראה מיזוג שאילתות.
-
בחר השתמש בהתאמה מטושטשת כדי לבצע את המיזוג, בחר אפשרויות תואמות מטושטשות ולאחר מכן בחר מבין האפשרויות הבאות:
-
סף דמיון ציון האופן שבו שני ערכים דומים צריכים להיות דומים כדי להתאים. הערך המינימלי של 0.00 גורם לכל הערכים להתאים זה לזה. הערך המרבי של 1.00 מאפשר התאמות מדויקות בלבד. ערך ברירת המחדל הוא 0.80.
-
התעלם רישיות ציון אם יש להשוות ערכי טקסט באופן תלוי רישיות או לא תלוי-רישיות. אופן הפעולה המהווה ברירת מחדל אינו תלוי רישיות, כלומר התעלמות במקרה.
-
מספר ההתאמות המרבי קובע את המספר המרבי של שורות תואמות המוחזרות עבור כל שורת קלט. לדוגמה, אם ברצונך למצוא שורה תואמת אחת בלבד עבור כל שורת קלט, ציין ערך של 1. אופן הפעולה המהווה ברירת מחדל הוא החזרת כל ההתאמות.
-
טבלת המרה ציין שאילתה אחרת המכילה טבלת מיפוי, כך שניתן יהיה למפות ערכים מסוימים באופן אוטומטי כחלק מהלוגיקה התואמת. לדוגמה, הגדרת טבלה בעלת שתי עמודות עם עמודות טקסט "From" ו- "To" עם ערכים "Microsoft" ו- "MSFT" תגרום לכך שערכים אלה ייחשבו לאותו ערך (ניקוד דמיון של 1.00).
-
-
Power Query מנתח את שתי הטבלאות ומציג הודעה לגבי מספר ההתאמות שהיא ביצעה. בדוגמה, הבחירה תואמת ל- 3 מתוך 4 שורות מהטבלה הראשונה. מבלי להשתמש בהתאמה מטושטשת, רק 2 מתוך 4 שורות יתאימו.
-
אם אתה מרוצה, בחר אישור. אם לא, נסה אפשרויות מיזוג מטושטשות שונות כדי להתאים אישית את החוויה שלך.
-
כאשר תהיה מרוצה, בחר אישור.