Sortare Hadoop / îmbinare / procesarea de grup
Soluții
Chiar dacă pre-sortare în Hadoop și apoi importați-RRE nu există nici o garanție că împarte va conține întreaga de grupuri sau fi procesate în ordinea corectă. Prin urmare, opțiunile restrângeți la intrare CSV și:
1) hive sau porc pentru sortare, îmbinare și procesare de grup.
2) rmr2 sau plyrmr pentru procesarea în R. de grup