Pădure și amplificat arbore predicție viteza pe Hadoop
-
În mod implicit, rxPredict lansează o lucrare MR per arbore pentru a minimiza utilizarea memoriei
-
Pentru mică seturi de date, apelați rxPredict în interiorul rxExec sau set scheduleOnce = TRUE (în 7.3) pentru a reduce aeriene programarea
– rxPredict (dforestObject, date = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Pentru seturile de date mai mare, setați scheduleOnce = 1 pentru a face predicție în paralel utilizând o singură lucrare MR (disponibil în 7.3; intern, utilizează rxDataStep pentru a apela predict.randomForest; necesită pachetul randomForest)
– rxPredict (dforestObject, date = myData, outData = myOutData, scheduleOnce = 1,...