Masuk dengan Microsoft
Masuk atau buat akun.
Halo,
Pilih akun lain.
Anda memiliki beberapa akun
Pilih akun yang ingin Anda gunakan untuk masuk.

Kinerja umum Hadoop pertimbangan

MapReduce pekerjaan dan tugas

  • Setiap ScaleR algoritma yang berjalan pada MapReduce memanggil satu atau lebih MapReduce pekerjaan, satu per satu

  • Pekerjaan MapReduce masing-masing terdiri dari satu atau lebih peta tugas

  • Peta tugas dapat menjalankan secara paralel

  • Set RxHadoopMR (... consoleOutput = TRUE...) untuk melacak kemajuan pekerjaan

MapReduce pekerjaan dan tugas penskalaan

  • Acak hutan dengan rxExec (kecil dan menengah data)

    • #jobs = 1

    • #tasks = nTrees (asali adalah 10)

    • Hutan acak (data besar, misalnya 100 GB +)

      • #jobs ~ nTrees * maxDepth (asali adalah 10 x 10; mulai kecil, misalnya 2 x 2)

      • #tasks = #inputSplits

    • Regresi logistik, GLM, k-berarti

      • #jobs = #iterations (biasanya 4-15 iterasi)

      • #tasks = #inputSplits

    • Garis regresi, regresi Ridge, rxImportControl #inputSplits dengan mengatur mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Perlu bantuan lainnya?

Ingin opsi lainnya?

Jelajahi manfaat langganan, telusuri kursus pelatihan, pelajari cara mengamankan perangkat Anda, dan banyak lagi.

Komunitas membantu Anda bertanya dan menjawab pertanyaan, memberikan umpan balik, dan mendengar dari para ahli yang memiliki pengetahuan yang luas.

Apakah informasi ini berguna?

Seberapa puaskah Anda dengan kualitas bahasanya?
Apa yang memengaruhi pengalaman Anda?
Dengan menekan kirim, umpan balik Anda akan digunakan untuk meningkatkan produk dan layanan Microsoft. Admin TI Anda akan dapat mengumpulkan data ini. Pernyataan Privasi.

Terima kasih atas umpan balik Anda!

×