Bosque y árbol se incrementó la velocidad de predicción en Hadoop

  • De forma predeterminada, se inicia un trabajo de MR por árbol para minimizar el uso de memoria rxPredict

  • Para conjuntos de datos pequeños, llamar a rxPredict dentro de rxExec o establecer scheduleOnce = TRUE (en 7.3) para reducir la sobrecarga de programación

-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • Para los más grandes conjuntos de datos, establecer scheduleOnce = 1 para realizar la predicción en paralelo mediante un único trabajo de MR (disponible en 7.3; internamente, utiliza rxDataStep para llamar a predict.randomForest; requiere el paquete de randomForest)

-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = 1,...

¿Necesita más ayuda?

¿Quiere más opciones?

Explore las ventajas de las suscripciones, examine los cursos de aprendizaje, aprenda a proteger su dispositivo y mucho más.

Las comunidades le ayudan a formular y responder preguntas, enviar comentarios y leer a expertos con conocimientos extensos.