Лес и скорость прогноза повышенный дерева на Hadoop
-
По умолчанию rxPredict запускает одно задание MR на дерево, чтобы уменьшить использование памяти
-
Smallish наборов данных, вызовите rxPredict внутри rxExec или задать scheduleOnce = TRUE (7.3) для уменьшения дополнительная нагрузка планирования
-rxPredict (dforestObject данных = myData outData = myOutData scheduleOnce = TRUE,...)
-
Для больших наборов данных, установите scheduleOnce = 1, чтобы сделать прогноз параллельно с использованием одного задания MR (в 7.3; внутренним образом использует rxDataStep для вызова predict.randomForest, требует пакета randomForest)
-rxPredict (dforestObject данных = myData outData = myOutData scheduleOnce = 1,...