Gäller förRevolution Analytics

Du kan använda samma funktioner för RevoScaleR för att bearbeta stora datamängder som lagrats på disken som du vill analysera i minnet dataramar. Detta beror på att RevoScaleR funktioner använder "dela upp" algoritmer. I princip så delningsstorlek algoritmer här:

  1. Initiering: mellanresultat som behövs för beräkningen av den slutliga statistiken har initierats

  2. Läsa data: läsa en datasegmentet (uppsättning observationer av variabler)

  3. Omvandla data: utföra omvandlingar och val av rad för datasegmentet efter behov. skriva ut data om bara den dataimport eller åtgärden

  4. Bearbeta data: beräkna mellanliggande resultat för segmentet av data

  5. Uppdatera resultatet: kombinera resultaten från segmentet av data med de föregående segment

  6. Upprepa steg (2) - (5) (kanske parallellt) tills alla data har bearbetats

  7. Bearbeta resultat: när resultaten från alla bitarna har slutförts gör slutliga beräkningar och returnera resultat

Behöver du mer hjälp?

Vill du ha fler alternativ?

Utforska prenumerationsförmåner, bläddra bland utbildningskurser, lär dig hur du skyddar din enhet med mera.