Lesa a strom modelovania presnosti
Ladenie rxDForest parametre (rýchlosť vplyvu) (*: OSR a RRE predvolené)
-Zvýšenie nTree, napríklad na 20 (OSR = 500 RRE = 10) *
-Zvýšiť maxDepth, napríklad na 20 (OSR = nedostupný, RRE = 10) *
-Znížiť minSplit, napríklad na 2 (OSR = 5, RRE=sqrt(N)) *
-Zvýšenie mTry, napríklad na 40 alebo viac (OSR/RRE=sqrt(p) alebo p/3) *
-Zvýšenie maxNumBins, napríklad až 1e5 1e6
-Presnosť 81,4% KDD dataset pomocou nasledovných nárastu 82,3% pri ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Môžete tiež naraziť otvorený randomForest bežné Nobotto klastra pomocou rxExec
-Pozri randomShrubbery v časti 6.5 sprievodcu Distributed Computing
-Upraviť MR pamäte obmedzenia, ak je to potrebné, pretože údaje musíte prispôsobiť v pamäti na každom uzle.