Du kan använda samma funktioner för RevoScaleR för att bearbeta stora datamängder som lagrats på disken som du vill analysera i minnet dataramar. Detta beror på att RevoScaleR funktioner använder "dela upp" algoritmer. I princip så delningsstorlek algoritmer här:
-
Initiering: mellanresultat som behövs för beräkningen av den slutliga statistiken har initierats
-
Läsa data: läsa en datasegmentet (uppsättning observationer av variabler)
-
Omvandla data: utföra omvandlingar och val av rad för datasegmentet efter behov. skriva ut data om bara den dataimport eller åtgärden
-
Bearbeta data: beräkna mellanliggande resultat för segmentet av data
-
Uppdatera resultatet: kombinera resultaten från segmentet av data med de föregående segment
-
Upprepa steg (2) - (5) (kanske parallellt) tills alla data har bearbetats
-
Bearbeta resultat: när resultaten från alla bitarna har slutförts gör slutliga beräkningar och returnera resultat