ฟอเรสต์และความเร็วในการคาดเดาทรี Boosted บน Hadoop
-
โดยค่าเริ่มต้น rxPredict เปิดใช้งาน MR หนึ่งสำหรับแต่ละแผนภูมิเพื่อลดการใช้หน่วยความจำ
-
สำหรับชุดข้อมูล smallish โทร rxPredict ภายใน rxExec หรือตั้งค่า scheduleOnce = TRUE (ใน 7.3) เพื่อลดการจัดกำหนดการค่าใช้จ่ายใน
– rxPredict (dforestObject ข้อมูล = myData, outData = myOutData, scheduleOnce = TRUE,...)
-
สำหรับชุดข้อมูลขนาดใหญ่ ตั้งค่า scheduleOnce = 1 เพื่อทำการคาดเดาพร้อมกันใช้งาน MR เดี่ยว (พร้อมใช้งานใน 7.3 ภายใน ใช้ rxDataStep เพื่อเรียก predict.randomForest ต้องการแพคเกจ randomForest)
– rxPredict (dforestObject ข้อมูล = myData, outData = myOutData, scheduleOnce = 1,...