QA: Hvordan RevoScaleR chunking algoritmer fungerer?

Støtte

Logg på

Logg på med Microsoft

Logg på, eller opprett en konto.

Hei,

Velg en annen konto.

Du har flere kontoer

Velg kontoen du vil logge på med.

Gjelder for

Revolution Analytics

Du kan bruke de samme RevoScaleR-funksjonene til å behandle store datasett som er lagret på disk som du gjør for å analysere data i minnet rammer. Dette er fordi RevoScaleR funksjoner bruker "dele opp" algoritmer. I utgangspunktet, dele opp algoritmer følger denne prosessen:

Initialisering: mellomliggende resultater som er nødvendig for beregning av statistikk for endelig er initialisert
Lese data: lese en datasegment (sett observasjoner av variabler)
Transformere dataene: utføre transformasjoner og rad valg for mengde data etter behov. skrive ut data hvis bare dataimport eller grepet
Behandle data: beregne mellomliggende resultater for delen av data
Oppdatere resultater: kombinere resultater fra delen av dataene med de tidligere deler
Gjenta trinn (2) - (5) (kanskje parallelt) før alle dataene er behandlet
Behandle resultater: når resultatene fra alle deler er fullført, gjøre endelige beregninger og returnere resultater