RevoScaleR Funktionen können zu große Datensätze auf der Festplatte gespeichert, wie um Frames Daten im Speicher zu analysieren. Ist RevoScaleR Funktionen "chunking" Algorithmen verwenden. Im Grunde Verfahren chunking Algorithmen:
-
Initialisierung: Zwischenergebnisse zur Berechnung des endgültigen Statistik werden initialisiert
-
Daten lesen: Lesen Datenmenge (Satz von Beobachtung der Variablen)
-
Transformieren von Daten: Ausführen von Transformationen und Zeilenauswahl für Datenmenge Bedarf Daten schreiben Sie, wenn nur Daten importiert oder Schritt ausführen
-
Daten: Zwischenergebnisse für den Teil der Daten zu berechnen
-
Ergebnisse aktualisieren: die Ergebnisse aus der Abschnitt mit den vorherigen Abschnitten kombinieren
-
Wiederholen Sie die Schritte 2 - 5 Buchstabe (möglicherweise parallel) bis alle Daten verarbeitet wurden
-
Ergebnisse: Abschluss Ergebnisse aus allen Segmenten, endgültige Berechnung und zurück Ergebnisse