Sortuj Hadoop / Scal / przetwarzania przez grupy
Rozwiązania problemu
Nawet jeśli wstępne sortowanie w Hadoop, a następnie zaimportować do RRE nie ma żadnej gwarancji, że podziały będzie zawierać cały przez grupy lub być przetwarzane w odpowiedniej kolejności. Dlatego opcje zawęzić zakres danych wejściowych CSV i:
(1) gałąź rejestru lub trzody chlewnej do sortowania, korespondencji seryjnej i przetwarzania przez grupę.
(2) rmr2 lub plyrmr dla przetwarzania w R. przez grupy