Hutan dan meningkatkan struktur prediksi kecepatan Hadoop

  • Secara default, rxPredict Luncurkan pekerjaan MR per pohon meminimalkan penggunaan memori

  • Kumpulan data bertubuh kecil, hubungi rxPredict di dalam rxExec atau set scheduleOnce = TRUE (dalam 7.3) untuk mengurangi penjadwalan atashulu

-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • Untuk set data yang lebih besar, atur scheduleOnce = 1 untuk melakukan prediksi secara paralel menggunakan pekerjaan MR tunggal (tersedia di 7,3; internal, menggunakan rxDataStep memanggil predict.randomForest; memerlukan paket randomForest)

-rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = 1,...

Perlu bantuan lainnya?

Kembangkan keterampilan Anda
Jelajahi pelatihan
Dapatkan fitur baru terlebih dahulu
Gabung Microsoft Insider

Apakah informasi ini bermanfaat?

Seberapa puaskah Anda dengan kualitas bahasanya?
Apa yang memengaruhi pengalaman Anda?

Terima kasih atas umpan balik Anda!

×