樹系和 Hadoop 上的提高樹狀結構預測速度
-
根據預設,rxPredict 會啟動一個 MR 工作,每一個記憶體使用量降到最低的樹狀目錄
-
松果的資料集,請在呼叫內部 rxExec 的 rxPredict,或設定 scheduleOnce = TRUE (以 7.3),以減少排程的額外負荷
– rxPredict (dforestObject,資料 = myData,outData = myOutData,scheduleOnce = TRUE,...)
-
較大的資料集,設定 scheduleOnce = 1,要使用單一的 MR 工作的平行預測 (用於 7.3; 在內部,使用呼叫 predict.randomForest 的 rxDataStep; 需要 randomForest 套件)
– rxPredict (dforestObject,資料 = myData,outData = myOutData,scheduleOnce = 1,...