Stejné funkce RevoScaleR můžete použít ke zpracování velké datové sady uložené na disku, stejně jako při analýze dat v paměti rámců. Je to proto, že "bloků" algoritmy pomocí funkce RevoScaleR. V podstatě bloků algoritmy řídí tímto postupem:
-
Inicializace: průběžné výsledky potřebné pro výpočet konečné statistiky jsou inicializovány.
-
Čtení dat: čtení bloku dat (sada pozorování proměnných)
-
Transformace dat: provedení transformace a výběrů řádku bloku dat podle potřeby; Pokud pouze provedením kroku importu nebo data zapsat data
-
Zpracování dat: vypočítat průběžné výsledky k bloku dat dat
-
Aktualizovat výsledky: kombinuje výsledky z bloku dat data s těmi předchozí bloky
-
Opakujte kroky 2 - (5) (možná paralelně) dokud všechna data byla zpracována.
-
Zpracování výsledků: dokončení výsledky ze všech bloků proveďte závěrečné vyúčtování a vrátit výsledky