Floresta e velocidade de prognóstico de árvore aumentadas em Hadoop
-
Por padrão, rxPredict inicia um trabalho MR por árvore para minimizar o uso da memória
-
Bem pequenos conjuntos de dados, chamar rxPredict em rxExec ou definir scheduleOnce = TRUE (em 7.3) para reduzir a sobrecarga de agendamento
-rxPredict (dforestObject, dados = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Para conjuntos de dados maiores, definir scheduleOnce = 1 para fazer previsão em paralelo usando um único trabalho MR (disponível em 7.3; internamente, usa rxDataStep para chamar predict.randomForest; requer o pacote de randomForest)
-rxPredict (dforestObject, dados = myData, outData = myOutData, scheduleOnce = 1,...