Bỏ qua để tới nội dung chính
Đăng nhập với Microsoft
Đăng nhập hoặc tạo một tài khoản.
Xin chào,
Chọn một tài khoản khác.
Bạn có nhiều tài khoản
Chọn tài khoản bạn muốn đăng nhập.

Xem xét hiệu suất chung Hadoop

MapReduce công việc và tác vụ

  • Mỗi thuật toán ScaleR chạy MapReduce invokes một hoặc nhiều công việc MapReduce, một

  • Mỗi công việc MapReduce bao gồm một hoặc nhiều tác vụ đồ

  • Bản đồ tác vụ có thể thực thi song song

  • Thiết lập RxHadoopMR (... consoleOutput = TRUE...) để theo dõi tiến độ công việc

MapReduce công việc và tác vụ mở rộng

  • Nhóm ngẫu nhiên với rxExec (nhỏ vừa dữ liệu)

    • #jobs = 1

    • #tasks = nTrees (mặc định là 10)

    • Nhóm ngẫu nhiên (dữ liệu lớn, ví dụ: 100 GB +)

      • #jobs ~ nTrees * maxDepth (mặc định là 10 x 10; bắt đầu nhỏ, ví dụ: 2 x 2)

      • #tasks = #inputSplits

    • Hậu cần hồi quy, GLM, k-phương tiện

      • #jobs = #iterations (thường 4-15 lặp)

      • #tasks = #inputSplits

    • Tuyến tính hồi qui, hồi quy Ridge, rxImportControl #inputSplits bằng cách đặt mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Bạn cần thêm trợ giúp?

Bạn muốn xem các tùy chọn khác?

Khám phá các lợi ích của gói đăng ký, xem qua các khóa đào tạo, tìm hiểu cách bảo mật thiết bị của bạn và hơn thế nữa.

Cộng đồng giúp bạn đặt và trả lời các câu hỏi, cung cấp phản hồi và lắng nghe ý kiến từ các chuyên gia có kiến thức phong phú.

Thông tin này có hữu ích không?

Bạn hài lòng đến đâu với chất lượng dịch thuật?
Điều gì ảnh hưởng đến trải nghiệm của bạn?
Khi nhấn gửi, phản hồi của bạn sẽ được sử dụng để cải thiện các sản phẩm và dịch vụ của Microsoft. Người quản trị CNTT của bạn sẽ có thể thu thập dữ liệu này. Điều khoản về quyền riêng tư.

Cảm ơn phản hồi của bạn!

×