Bosque y árbol se incrementó la velocidad de predicción en Hadoop
-
De forma predeterminada, se inicia un trabajo de MR por árbol para minimizar el uso de memoria rxPredict
-
Para conjuntos de datos pequeños, llamar a rxPredict dentro de rxExec o establecer scheduleOnce = TRUE (en 7.3) para reducir la sobrecarga de programación
-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Para los más grandes conjuntos de datos, establecer scheduleOnce = 1 para realizar la predicción en paralelo mediante un único trabajo de MR (disponible en 7.3; internamente, utiliza rxDataStep para llamar a predict.randomForest; requiere el paquete de randomForest)
-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = 1,...