Hadoop sorteren / samenvoegen / verwerking door groep
Tijdelijke oplossingen
Zelfs als u vooraf in Hadoop sorteren en vervolgens op RRE importeren is er geen garantie dat de splitsingen hele door groepen bevatten of in de juiste volgorde worden verwerkt. Dus de opties beperken naar CSV-invoer en:
1) component of varkens voor sorteren, samenvoegen en de verwerking door de groep.
2) rmr2 of plyrmr voor verwerking in R. per groep