林和提升的树上 Hadoop 的预测速度
-
默认情况下,rxPredict 将启动一个 MR 作业,每个树,以尽量减少内存使用情况
-
Smallish 数据集时,调用 rxPredict rxExec 内的或设置 scheduleOnce = TRUE (以 7.3),以减少计划开销
--rxPredict (dforestObject,数据 = myData,outData myOutData,scheduleOnce =...= TRUE,)
-
对于大数据集时,将设置 scheduleOnce = 1 做预测中使用单个先生作业并行 (7.3; 在内部,使用 rxDataStep 来调用 predict.randomForest; 要求 randomForest 包)
--rxPredict (dforestObject,数据 = myData,outData = myOutData,scheduleOnce = 1,...