คุณสามารถใช้ฟังก์ชัน RevoScaleR เดียวกันในการประมวลผลชุดข้อมูลขนาดใหญ่ที่เก็บอยู่บนดิสก์เหมือนที่คุณทำการวิเคราะห์ข้อมูลในหน่วยความจำเฟรม เป็นเช่นนี้ เพราะฟังก์ชัน RevoScaleR ใช้อัลกอริทึมที่ 'chunking' ทั่วไป อัลกอริทึม chunking ให้ทำตามขั้นตอนนี้:
-
การเตรียมใช้งาน: ผลลัพธ์ขั้นกลางที่จำเป็นสำหรับการคำนวณสถิติขั้นสุดท้ายจะถูกเตรียมใช้งาน
-
อ่านข้อมูล: อ่านกลุ่ม (ชุดของค่าสังเกตของตัวแปร) ของข้อมูล
-
แปลงข้อมูล: ทำการแปลงและเลือกแถวสำหรับกลุ่มของข้อมูลตามความจำเป็น เขียนออกมาข้อมูลก็ดำเนินการขั้นตอนการนำเข้าหรือข้อมูล
-
ประมวลผลข้อมูล: คำนวณผลลัพธ์สำหรับกลุ่มระหว่างกลางของข้อมูล
-
ปรับปรุงผลลัพธ์: รวมผลลัพธ์จากกลุ่มของข้อมูลกับของกลุ่มก่อนหน้านี้
-
ทำซ้ำขั้นตอน (2) - (5) (อาจเป็นขนาน) จนกว่าข้อมูลทั้งหมดที่มีการประมวลผล
-
ประมวลผล: เมื่อผลลัพธ์จากกลุ่มทั้งหมดเสร็จเรียบร้อย ทำการประมวลผลขั้นสุดท้าย และส่งกลับผลลัพธ์