Insieme di strutture e struttura incrementata Stima velocità su Hadoop
-
Per impostazione predefinita, rxPredict consente di avviare un processo di MR per albero per ridurre al minimo l'utilizzo della memoria
-
Per ritenerci i set di dati, chiamare rxPredict in rxExec oppure impostare scheduleOnce = TRUE (in 7.3) per ridurre l'overhead di programmazione
-rxPredict (dforestObject, dati = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Per i set di dati più grande, impostare scheduleOnce = 1 per effettuare una stima in parallelo utilizzando un singolo processo di MR (disponibile in 7.3; internamente, rxDataStep viene utilizzata per chiamare predict.randomForest; richiede che il pacchetto di randomForest)
-rxPredict (dforestObject, dati = myData, outData = myOutData, scheduleOnce = 1,...