Applies ToRevolution Analytics

Floresta e velocidade de prognóstico de árvore aumentadas em Hadoop

  • Por padrão, rxPredict inicia um trabalho MR por árvore para minimizar o uso da memória

  • Bem pequenos conjuntos de dados, chamar rxPredict em rxExec ou definir scheduleOnce = TRUE (em 7.3) para reduzir a sobrecarga de agendamento

-rxPredict (dforestObject, dados = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • Para conjuntos de dados maiores, definir scheduleOnce = 1 para fazer previsão em paralelo usando um único trabalho MR (disponível em 7.3; internamente, usa rxDataStep para chamar predict.randomForest; requer o pacote de randomForest)

-rxPredict (dforestObject, dados = myData, outData = myOutData, scheduleOnce = 1,...

Precisa de mais ajuda?

Quer mais opções

Explore os benefícios da assinatura, procure cursos de treinamento, saiba como proteger seu dispositivo e muito mais.

As comunidades ajudam você a fazer e responder perguntas, fazer comentários e ouvir especialistas com conhecimento avançado.