Skog og Boosted treet forutsigelse hastighet på Hadoop
-
Som standard starter rxPredict en MR jobb per treet for å minimere minnebruk
-
Ring rxPredict i rxExec for smallish datasett, eller angi scheduleOnce = TRUE (i 7.3) for å redusere planleggingen indirekte
– rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
For større datasett, kan du angi scheduleOnce = 1 for å gjøre forutsigelse parallelt med en enkelt jobb MR (tilgjengelig i 7.3; internt, bruker rxDataStep til å kalle predict.randomForest; krever randomForest-pakke)
– rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = 1,...