林和树建模准确性
调整 rxDForest 参数 (速度折中方案) (*: OSR,RRE 默认值)
--增加 nTree,例如为 20 或更多 (OSR = 500,RRE = 10) *
--增加 maxDepth,例如为 20 或更多 (OSR = n/A,RRE = 10) *
– 减少 minSplit,例如为 2 (OSR = 5,RRE=sqrt(N)) *
--增加 mTry,例如到 40 或更多 (OSR/RRE=sqrt(p) 或 p/3) *
--增加 maxNumBins,如为 1e5 或 1e6
– 与 KDD 数据集使用以下为 82.3%的进一步增长 81.4%的准确性时 ntree = 200:
ntree=20, mtry=40, minSplit=2, maxDepth=20, maxNumBins=1e6
-
另外,通过使用 rxExec Hadoop 群集运行开源 randomForest 例程
– 请参阅 randomShrubbery 中的我们的分布式计算指南部分 6.5
– 如果需要因为数据必须适合每个节点的内存中,则调整先生内存限制。