Las i prędkość przewidywania drzewa promowane na Hadoop
-
Domyślnie rxPredict uruchamia jedno zadanie MR na jedno drzewo, aby zminimalizować użycie pamięci
-
Dla niewielkich zestawów danych, należy wywołać rxPredict wewnątrz rxExec lub ustaw scheduleOnce = TRUE (w ppkt 7.3.), aby zmniejszyć, planowanie zapasu
-rxPredict (dforestObject, Dane Moje_Dane, outData = = myOutData scheduleOnce = TRUE,...)
-
W przypadku większych zestawów danych, należy ustawić scheduleOnce = 1 w celu przewidywania z użyciem pojedynczego zadania Pan (dostępne w pkt 7.3; wewnętrznie, używa rxDataStep do wywołania predict.randomForest; wymaga pakietu randomForest)
-rxPredict (dforestObject, Dane Moje_Dane, outData = = myOutData scheduleOnce = 1,...