Hutan dan meningkatkan struktur prediksi kecepatan Hadoop
-
Secara default, rxPredict Luncurkan pekerjaan MR per pohon meminimalkan penggunaan memori
-
Kumpulan data bertubuh kecil, hubungi rxPredict di dalam rxExec atau set scheduleOnce = TRUE (dalam 7.3) untuk mengurangi penjadwalan atashulu
-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
Untuk set data yang lebih besar, atur scheduleOnce = 1 untuk melakukan prediksi secara paralel menggunakan pekerjaan MR tunggal (tersedia di 7,3; internal, menggunakan rxDataStep memanggil predict.randomForest; memerlukan paket randomForest)
-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = 1,...