Gesamtstruktur und Modellierung Genauigkeit
RxDForest Parameter (Geschwindigkeit abgewogen) optimieren (*: OSR und RRE Standards)
– NTree, z. B. auf mindestens 20 zu erhöhen (ASR = 500 RRE = 10) *
– MaxDepth z. B. auf mindestens 20 zu erhöhen (ASR = NV RRE = 10) *
– Reduzieren Sie MinSplit, z. B. auf 2 (ASR = 5, RRE=sqrt(N)) *
– Erhöhen Sie mTry, z. B. auf 40 oder mehr (OSR/RRE=sqrt(p) oder P/3) *
– MaxNumBins, 1e5 oder 1e6 zu erhöhen
– Genauigkeit von 81,4 % KDD DataSet mit den folgenden mit einem weiteren 82,3 % bei Ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Führen Sie die open-Source-RandomForest-Routine Alternativ Hadoop Cluster mit RxExec aus
– Finden Sie in Abschnitt 6.5 unseres Stadtführers Distributed Computing randomShrubbery
– Stellen Sie HERR Speicherlimits da Daten im Speicher auf jedem Knoten anpassen müssen.