Ajuste de bosque y árbol se incrementó la velocidad de predicción en Hadoop

Bosque y árbol se incrementó la velocidad de predicción en Hadoop

  • De forma predeterminada, se inicia un trabajo de MR por árbol para minimizar el uso de memoria rxPredict

  • Para conjuntos de datos pequeños, llamar a rxPredict dentro de rxExec o establecer scheduleOnce = TRUE (en 7.3) para reducir la sobrecarga de programación

-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • Para los más grandes conjuntos de datos, establecer scheduleOnce = 1 para realizar la predicción en paralelo mediante un único trabajo de MR (disponible en 7.3; internamente, utiliza rxDataStep para llamar a predict.randomForest; requiere el paquete de randomForest)

-rxPredict (dforestObject, datos = myData, outData = myOutData, scheduleOnce = 1,...

¿Necesita más ayuda?

Ampliar sus conocimientos
Explorar los cursos
Obtener nuevas características primero
Unirse a Microsoft Insider

¿Le ha sido útil esta información?

¡Gracias por sus comentarios!

Gracias por sus comentarios. Quizá le interese ponerse en contacto con uno de nuestros agentes de soporte de Office.

×