Anda dapat menggunakan fungsi RevoScaleR yang sama untuk memproses besar set data yang tersimpan pada disk seperti yang Anda lakukan untuk menganalisis data dalam memori frame. Hal ini karena fungsi RevoScaleR menggunakan algoritma 'chunking'. Pada dasarnya, algoritma chunking mengikuti proses ini:
-
Inisialisasi: menengah hasil yang diperlukan untuk perhitungan Statistik akhir diinisialisasi
-
Membaca data: membaca potongan (serangkaian pengamatan variabel) data
-
Transformasi data: melakukan transformasi dan baris pilihan untuk potongan data yang diperlukan; menulis data jika hanya melakukan langkah impor atau data
-
Proses data: menghitung menengah hasil untuk potongan data
-
Memperbarui hasil: menggabungkan hasil dari potongan data dengan potongan sebelumnya
-
Ulangi langkah (2) - (5) (mungkin secara paralel) sampai semua data yang telah diproses
-
Proses hasil: ketika hasil dari semua potongan selesai, lakukan akhir perhitungan dan mengembalikan hasil