Σύμπλεγμα δομών και ενισχύεται δέντρο πρόβλεψης ταχύτητας σε Hadoop
-
Από προεπιλογή, rxPredict, ξεκινά μια εργασία MR ανά δέντρο, για να ελαχιστοποιήσετε τη χρήση της μνήμης
-
Για smallish σύνολα δεδομένων, καλέστε rxPredict μέσα σε rxExec ή να ορίσετε scheduleOnce = TRUE (σε 7.3) για να μειώσετε τον προγραμματισμό επιβάρυνση
– rxPredict (dforestObject, δεδομένων = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Για μεγαλύτερα σύνολα δεδομένων, ορίστε scheduleOnce = 1 για να γίνει πρόβλεψη παράλληλα χρησιμοποιώντας μία μόνο εργασία MR (διαθέσιμη στο 7.3, εσωτερικά, χρησιμοποιείται rxDataStep για την κλήση predict.randomForest; απαιτεί το πακέτο randomForest)
– rxPredict (dforestObject, δεδομένων = myData, outData = myOutData, scheduleOnce = 1,...