QA: Hoe de RevoScaleR chunking algoritmen werken?

U kunt dezelfde functies RevoScaleR enorme gegevenssets opgeslagen op schijf als u voor het analyseren van gegevens in het geheugen frames worden verwerkt. Dit komt doordat de RevoScaleR functies "afscheuren" algoritmen gebruiken. In principe in chunking algoritmen dit proces als volgt:

Initialisatie: tussentijdse resultaten die nodig zijn voor de berekening van de definitieve statistieken worden geïnitialiseerd.
Gegevens lezen: Lees een gegevenssegment (aantal observaties van variabelen)
Transformatie van gegevens: transformaties en rij selecties uitvoeren voor het segment van de gegevens zo nodig; gegevens wegschrijven als alleen importeren of gegevens stap uitvoeren
Gegevens verwerken: tussentijdse resultaten voor het segment van de gegevens berekenen
Resultaten bijwerken: de resultaten van het segment van de gegevens combineren met die van de vorige stukken
Herhaal de stappen (2) - (5) (mogelijk in parallel) tot alle gegevens zijn verwerkt.
Resultaten verwerken: wanneer de resultaten van alle stukken zijn voltooid, kan de definitieve berekeningen en terug te keren resultaten

QA: Hoe de RevoScaleR chunking algoritmen werken?

Meer hulp nodig?

Meer opties?

Was deze informatie nuttig?

Hartelijk dank voor uw feedback.