Bảo đảm chất lượng: Thuật toán chunking RevoScaleR hoạt động thế nào?

Bạn có thể sử dụng chức năng RevoScaleR cùng xử lý lớn tập dữ liệu được lưu trữ trên đĩa như bạn để phân tích dữ liệu trong bộ nhớ khung. Điều này là do RevoScaleR chức năng sử dụng thuật toán 'chunking'. Về cơ bản, thuật toán chunking tuân theo quy trình này:

  1. Cài đặt: kết quả trung gian cho tính toán số liệu thống kê cuối cùng được khởi tạo

  2. Đọc dữ liệu: đọc đoạn dữ liệu (tập quan sát biến)

  3. Chuyển đổi dữ liệu: thực hiện chuyển đổi và lựa chọn hàng đoạn dữ liệu theo yêu cầu; viết dữ liệu nếu chỉ thực hiện bước nhập hoặc dữ liệu

  4. Xử lý dữ liệu: tính kết quả trung gian cho đoạn dữ liệu

  5. Cập Nhật kết quả: kết hợp các kết quả từ đoạn dữ liệu với khối trước đó

  6. Lặp lại bước (2) - (5) (có lẽ song song) cho đến khi tất cả dữ liệu đã được xử lý

  7. Xử lý kết quả: khi kết quả từ tất cả các khối đã được hoàn thành, thực hiện việc tính toán cuối cùng và trả lại kết quả

Bạn cần thêm trợ giúp?

Phát triển các kỹ năng của bạn
Khám phá nội dung đào tạo
Sở hữu tính năng mới đầu tiên
Tham gia Microsoft dùng nội bộ

Thông tin này có hữu ích không?

Cảm ơn phản hồi của bạn!

Cảm ơn bạn đã phản hồi! Để trợ giúp tốt hơn, có lẽ chúng tôi sẽ kết nối bạn với một trong những nhân viên hỗ trợ Office của chúng tôi.

×