Miško ir modeliavimo tikslumą medis
Reguliavimo rxDForest parametrai (greitis pusiausvyrą) (*: OSR ir SAE200 numatytųjų reikšmių)
-Padidinti nTree, pvz., 20 ar daugiau (OSR = 500, SAE200 = 10) *
-Padidinti maxDepth, pvz., 20 ar daugiau (OSR = N/A, SAE200 = 10) *
– Sumažinti minSplit, pvz., 2 (OSR = 5, RRE=sqrt(N)) *
-Padidinti mTry, pvz., 40 ar daugiau (OSR/RRE=sqrt(p) arba p/3) *
-Padidinti maxNumBins, pvz., 1e5 arba 1e6
– Tikslumas 81,4 % KDD duomenų rinkinio, naudojant su daugiau 82,3 % kai ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Taip pat paleisti atvirojo kodo randomForest įprastus visoje Hadoop grupės naudojant rxExec
– RandomShrubbery 6.5 punkte paskirstytųjų kompiuterių vadovą žr.
– Pakeiskite MR atminties ribas, jei todėl duomenys turi atitikti atminties į kiekvieną mazgą.