포리스트 및 트리 증폭 예측 속도 Hadoop에
-
RxPredict은 기본적으로 메모리 사용량을 최소화 하기 위해 트리 당 하나의 MR 작업을 시작 합니다.
-
Smallish 데이터 집합에 대 한 내 rxExec rxPredict를 호출 하거나 scheduleOnce 설정 = TRUE (7.3)에서 예약 오버 헤드를 줄이기 위해
-rxPredict (dforestObject, 데이터 myData, outData = myOutData, scheduleOnce = TRUE, =...)
-
더 큰 데이터 집합에 대 한 scheduleOnce를 설정 = 1 단일 MR 작업을 사용 하 여 병렬로 예측 할 (7.3;에서 사용할 수 있는 내부적으로 rxDataStep를 사용 하 여 predict.randomForest 호출; randomForest 패키지 필요)
-rxPredict (dforestObject, 데이터 myData, outData = = myOutData, scheduleOnce = 1,...