Miško ir modeliavimo tikslumą medis
Reguliavimo rxDForest parametrai (greitis pusiausvyrą) (*: OSR ir SAE200 numatytųjų reikšmių) -Padidinti nTree, pvz., 20 ar daugiau (OSR = 500, SAE200 = 10) * -Padidinti maxDepth, pvz., 20 ar daugiau (OSR = N/A, SAE200 = 10) * – Sumažinti minSplit, pvz., 2 (OSR = 5, RRE=sqrt(N)) * -Padidinti mTry, pvz., 40 ar daugiau (OSR/RRE=sqrt(p) arba p/3) * -Padidinti maxNumBins, pvz., 1e5 arba 1e6 – Tikslumas 81,4 % KDD duomenų rinkinio, naudojant su daugiau 82,3 % kai ntree = 200: ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6-
Taip pat paleisti atvirojo kodo randomForest įprastus visoje Hadoop grupės naudojant rxExec
– RandomShrubbery 6.5 punkte paskirstytųjų kompiuterių vadovą žr.
– Pakeiskite MR atminties ribas, jei todėl duomenys turi atitikti atminties į kiekvieną mazgą.