Berlaku Untuk
Revolution Analytics

Hutan dan meningkatkan struktur prediksi kecepatan Hadoop

  • Secara default, rxPredict Luncurkan pekerjaan MR per pohon meminimalkan penggunaan memori

  • Kumpulan data bertubuh kecil, hubungi rxPredict di dalam rxExec atau set scheduleOnce = TRUE (dalam 7.3) untuk mengurangi penjadwalan atashulu

-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • Untuk set data yang lebih besar, atur scheduleOnce = 1 untuk melakukan prediksi secara paralel menggunakan pekerjaan MR tunggal (tersedia di 7,3; internal, menggunakan rxDataStep memanggil predict.randomForest; memerlukan paket randomForest)

-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = 1,...

Perlu bantuan lainnya?

Ingin opsi lainnya?

Jelajahi manfaat langganan, telusuri kursus pelatihan, pelajari cara mengamankan perangkat Anda, dan banyak lagi.