יער ומהירות חיזוי עץ מוגבר על Hadoop
-
כברירת מחדל, rxPredict מפעילה משימת MR אחד לכל עץ כדי למזער את השימוש בזיכרון
-
עבור ערכות נתונים smallish, התקשר rxPredict בתוך rxExec או להגדיר scheduleOnce = TRUE (ב- 7.3) כדי להפחית את תזמון תקורה
– rxPredict (dforestObject, הנתונים = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
עבור ערכות נתונים גדולים יותר, להגדיר scheduleOnce = 1 כדי לבצע חיזוי במקביל באמצעות משימת MR יחיד (זמין ב- 7.3; באופן פנימי, משתמשת rxDataStep כדי לקרוא predict.randomForest; דורשת את החבילה randomForest)
– rxPredict (dforestObject, הנתונים = myData, outData = myOutData, scheduleOnce = 1,...