Meža un precizitāti modelēšanas koks
Regulējiet rxDForest parametri (ātrums tirdzniecības-off) (*: OSR un RRE noklusējumus)
— Palielināt nTree, piemēram, lai 20 vai vairāk (OSR 500 RRE = = 10) *
— Palielināt maxDepth, piemēram, lai 20 vai vairāk (OSR n/a, RRE = = 10) *
-Samazināt minSplit, piemēram, uz 2 (OSR = 5 RRE=sqrt(N)) *
— Palielināt mTry, piemēram, uz 40 vai vairāk (OSR/RRE=sqrt(p) vai p/3) *
— Palielināt maxNumBins, piemēram, uz 1 E5 vai 1e6
-KDD dataset šim izmantojot papildu pieaugumu 82,3 % 81.4 % precizitāti, ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Vai arī izmantojot rxExec Hadoop klastera sastapties atklātā koda randomForest kārtību
-Skatiet mūsu dalītās skaitļošanas rokasgrāmatas sadaļu 6.5 randomShrubbery
-Ja nepieciešams, jo dati ir ietilpst atmiņas uz katru mezglu pielāgot MR atmiņas ierobežojumi.