Môžete použiť rovnaké funkcie RevoScaleR spracovať veľké údaje súbory uložené na disku, ako analyzovať údaje v pamäti rámov. Dôvodom je skutočnosť, že používajú "vytrhávanie" algoritmus RevoScaleR funkcie. V podstate vytrhávanie algoritmov tento postup:
-
Inicializácia: Priebežné výsledky, ktoré sú potrebné na výpočet konečného štatistiky sú inicializované
-
Čítanie údajov: Prečítajte si časť (súbor pripomienky premenných) údaje
-
Transformácia údajov: vykonať zmeny a riadok výberu časť údajov podľa potreby; zapísať údaje len krok import alebo údaje
-
Spracovanie údajov: výpočet Priebežné výsledky časť údajov
-
Aktualizácia výsledkov: kombinovať výsledky časť údajov s predchádzajúce množstvá
-
Zopakujte kroky 2 - 5 písmenách (možno súbežne) do všetkých údajov bola spracovaná.
-
Spracovanie výsledkov: pri splnení výsledky všetky množstvá sa konečné výpočty a vráti výsledky