Nhóm và cây mô hình chính xác
Điều chỉnh thông số rxDForest (tốc độ giá) (*: OSR và RRE mặc định)
-Tăng nTree, ví dụ: để 20 trở lên (OSR = 500, RRE = 10) *
-Tăng maxDepth, ví dụ: để 20 trở lên (OSR = N/A, RRE = 10) *
-Giảm minSplit, ví dụ: để 2 (OSR = 5, RRE=sqrt(N)) *
-Tăng mTry, ví dụ như vào 40 thêm (OSR/RRE=sqrt(p) hoặc p/3) *
-Tăng maxNumBins, ví dụ: để 1e5 hoặc 1e6
-Chính xác 81,4% dữ liệu KDD sử dụng sau tăng thêm 82.3% khi ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Ngoài ra, chạy thường xuyên randomForest nguồn mở trên cụm Hadoop sử dụng rxExec
-Xem randomShrubbery trong phần 6.5 của chúng tôi cung cấp máy tính
-Điều chỉnh giới hạn bộ nhớ ông nếu cần thiết từ dữ liệu phải nằm trong bộ nhớ trên mỗi nút.