Gesamtstruktur und Modellierung GenauigkeitRxDForest Parameter (Geschwindigkeit abgewogen) optimieren (*: OSR und RRE Standards)– NTree, z. B. auf mindestens 20 zu erhöhen (ASR = 500 RRE = 10) *– MaxDepth z. B. auf mindestens 20 zu erhöhen (ASR = NV RRE = 10) *– Reduzieren Sie MinSplit, z. B. auf 2 (ASR = 5, RRE=sqrt(N)) *– Erhöhen Sie mTry, z. B. auf 40 oder mehr (OSR/RRE=sqrt(p) oder P/3) *– MaxNumBins, 1e5 oder 1e6 zu erhöhen– Genauigkeit von 81,4 % KDD DataSet mit den folgenden mit einem weiteren 82,3 % bei Ntree = 200:ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
Führen Sie die open-Source-RandomForest-Routine Alternativ Hadoop Cluster mit RxExec aus
– Finden Sie in Abschnitt 6.5 unseres Stadtführers Distributed Computing randomShrubbery– Stellen Sie HERR Speicherlimits da Daten im Speicher auf jedem Knoten anpassen müssen.