Forêt et vitesse de prédiction d’arborescence amplifiée sur Hadoop
-
Par défaut, rxPredict lance une tâche de M. par arborescence afin de minimiser l’utilisation de la mémoire
-
Pour les jeux de données appellerions, appelez rxPredict à l’intérieur de rxExec, ou définir scheduleOnce = TRUE (en 7.3), afin de réduire la charge de planification
-rxPredict (dforestObject, données = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Pour les jeux de données volumineux, définissez scheduleOnce = 1 pour faire de prévision en parallèle à l’aide d’une seule tâche de M. (disponible dans 7.3 ; en interne, utilise rxDataStep pour appeler predict.randomForest ; requiert que le package de randomForest)
-rxPredict (dforestObject, données = myData, outData = myOutData, scheduleOnce = 1,...