Bạn có thể sử dụng chức năng RevoScaleR cùng xử lý lớn tập dữ liệu được lưu trữ trên đĩa như bạn để phân tích dữ liệu trong bộ nhớ khung. Điều này là do RevoScaleR chức năng sử dụng thuật toán 'chunking'. Về cơ bản, thuật toán chunking tuân theo quy trình này:
-
Cài đặt: kết quả trung gian cho tính toán số liệu thống kê cuối cùng được khởi tạo
-
Đọc dữ liệu: đọc đoạn dữ liệu (tập quan sát biến)
-
Chuyển đổi dữ liệu: thực hiện chuyển đổi và lựa chọn hàng đoạn dữ liệu theo yêu cầu; viết dữ liệu nếu chỉ thực hiện bước nhập hoặc dữ liệu
-
Xử lý dữ liệu: tính kết quả trung gian cho đoạn dữ liệu
-
Cập Nhật kết quả: kết hợp các kết quả từ đoạn dữ liệu với khối trước đó
-
Lặp lại bước (2) - (5) (có lẽ song song) cho đến khi tất cả dữ liệu đã được xử lý
-
Xử lý kết quả: khi kết quả từ tất cả các khối đã được hoàn thành, thực hiện việc tính toán cuối cùng và trả lại kết quả