Hadoop ordenação / intercalar / transformação por grupo
Soluções alternativas
Mesmo que a triagem prévia em Hadoop e, em seguida, importar para o RRE não é garantido que as divisões conterão por grupos de todo ou processadas na ordem correcta. Por conseguinte, as opções de limitar a entrada CSV e:
1) ramo de registo ou toucinho porco para ordenar, impressão em série e o processamento por grupo.
2) rmr2 ou plyrmr para transformação em r por grupo