U kunt dezelfde functies RevoScaleR enorme gegevenssets opgeslagen op schijf als u voor het analyseren van gegevens in het geheugen frames worden verwerkt. Dit komt doordat de RevoScaleR functies "afscheuren" algoritmen gebruiken. In principe in chunking algoritmen dit proces als volgt:
-
Initialisatie: tussentijdse resultaten die nodig zijn voor de berekening van de definitieve statistieken worden geïnitialiseerd.
-
Gegevens lezen: Lees een gegevenssegment (aantal observaties van variabelen)
-
Transformatie van gegevens: transformaties en rij selecties uitvoeren voor het segment van de gegevens zo nodig; gegevens wegschrijven als alleen importeren of gegevens stap uitvoeren
-
Gegevens verwerken: tussentijdse resultaten voor het segment van de gegevens berekenen
-
Resultaten bijwerken: de resultaten van het segment van de gegevens combineren met die van de vorige stukken
-
Herhaal de stappen (2) - (5) (mogelijk in parallel) tot alle gegevens zijn verwerkt.
-
Resultaten verwerken: wanneer de resultaten van alle stukken zijn voltooid, kan de definitieve berekeningen en terug te keren resultaten