Classificação de Hadoop / mesclar / processamento por grupo
Soluções alternativas
Mesmo se você classifica previamente em Hadoop e, em seguida, importar para RRE não há nenhuma garantia de que as divisões conterão todo por grupos ou ser processadas na ordem correta. Portanto, as opções restringir a entrada CSV e:
1) hive ou porco para classificar, mesclagem e processamento por grupo.
2) rmr2 ou plyrmr para processamento em R. por grupo