Du kan bruke de samme RevoScaleR-funksjonene til å behandle store datasett som er lagret på disk som du gjør for å analysere data i minnet rammer. Dette er fordi RevoScaleR funksjoner bruker "dele opp" algoritmer. I utgangspunktet, dele opp algoritmer følger denne prosessen:
-
Initialisering: mellomliggende resultater som er nødvendig for beregning av statistikk for endelig er initialisert
-
Lese data: lese en datasegment (sett observasjoner av variabler)
-
Transformere dataene: utføre transformasjoner og rad valg for mengde data etter behov. skrive ut data hvis bare dataimport eller grepet
-
Behandle data: beregne mellomliggende resultater for delen av data
-
Oppdatere resultater: kombinere resultater fra delen av dataene med de tidligere deler
-
Gjenta trinn (2) - (5) (kanskje parallelt) før alle dataene er behandlet
-
Behandle resultater: når resultatene fra alle deler er fullført, gjøre endelige beregninger og returnere resultater