Pohon pemodelan akurasi dan hutan
Menyetel parameter rxDForest (kecepatan pertukaran) (*: OSR dan RRE default)
– Meningkatkan nTree, misalnya untuk 20 atau lebih (OSR = 500, RRE = 10) *
– Meningkatkan maxDepth, misalnya untuk 20 atau lebih (OSR = N/A, RRE = 10) *
-Mengurangi minSplit, misalnya ke 2 (OSR = 5, RRE=sqrt(N)) *
– Meningkatkan mTry, misalnya untuk 40 atau lebih (OSR/RRE=sqrt(p) atau p/3) *
– Meningkatkan maxNumBins, misalnya untuk 1e5 atau 1e6
-Akurasi 81.4% dengan dataset KDD menggunakan berikut ini dengan meningkatkan lebih lanjut 82,3% saat ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Atau, jalankan rutin randomForest sumber terbuka di kluster Hadoop menggunakan rxExec
-Lihat randomShrubbery di bagian 6.5 kami didistribusikan panduan berkomputer
-Menyesuaikan batas memori MR jika diperlukan karena data harus cocok dalam memori di setiap node.