เรียงลำดับ Hadoop / ผสาน / การประมวลผลตามกลุ่ม
วิธีแก้ไขปัญหา
แม้ว่าคุณสามารถเรียงลำดับไว้ล่วงหน้าใน Hadoop แล้ว นำเข้าไปยัง RRE คุณไม่มีการรับประกันแยกจะประกอบด้วยทั้งโดยกลุ่ม หรือถูกประมวลผลในลำดับถูกต้อง จึงเป็น ตัวเลือกให้แคบลงให้ป้อนข้อมูล CSV และ:
1) ไฮฟ์ หรือ Pig สำหรับการเรียงลำดับ รวม และประมวลผลทีละกลุ่ม
2) rmr2 หรือ plyrmr สำหรับการประมวลผลโดย R. ตามกลุ่ม