Гора и дърво моделиране точност
Настройте rxDForest параметри (скорост размяна) (*: ПОС и RRE по подразбиране) -Увеличаване на nTree, например до 20 или повече (OSR = 500, RRE = 10) * -Увеличаване на maxDepth, например до 20 или повече (OSR = няма данни, RRE = 10) * -Намалява minSplit, например до 2 (OSR = 5, RRE=sqrt(N)) * -Увеличаване на mTry, например до 40 или повече (OSR/RRE=sqrt(p) или p/3) * -Увеличаване на maxNumBins, например за 1e5 или 1e6 -Точност на 81,4 % KDD набор данни с помощта на следното ново увеличение на 82.3 % при ntree = 200: ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6-
Освен това попадате отворен randomForest рутинни Hadoop клъстер с помощта на rxExec
-Вижте randomShrubbery в точка 6.5 от нашите разпределени компютърни Пътеводител
-Коригира MR ограниченията на памет при необходимост от данни трябва да се побере в паметта на всеки възел.