Pertimbangan kinerja Hadoop Umum - Dukungan Microsoft

Dukungan

Masuk

Masuk dengan Microsoft

Masuk atau buat akun.

Halo,

Pilih akun lain.

Anda memiliki beberapa akun

Pilih akun yang ingin Anda gunakan untuk masuk.

Revolution Analytics Lainnya...Lebih sedikit

Kinerja umum Hadoop pertimbangan

MapReduce pekerjaan dan tugas

Setiap ScaleR algoritma yang berjalan pada MapReduce memanggil satu atau lebih MapReduce pekerjaan, satu per satu
Pekerjaan MapReduce masing-masing terdiri dari satu atau lebih peta tugas
Peta tugas dapat menjalankan secara paralel
Set RxHadoopMR (... consoleOutput = TRUE...) untuk melacak kemajuan pekerjaan

MapReduce pekerjaan dan tugas penskalaan

Acak hutan dengan rxExec (kecil dan menengah data)
- #jobs = 1
- #tasks = nTrees (asali adalah 10)
- Hutan acak (data besar, misalnya 100 GB +)
  - #jobs ~ nTrees * maxDepth (asali adalah 10 x 10; mulai kecil, misalnya 2 x 2)
  - #tasks = #inputSplits
- Regresi logistik, GLM, k-berarti
  - #jobs = #iterations (biasanya 4-15 iterasi)
  - #tasks = #inputSplits
- Garis regresi, regresi Ridge, rxImportControl #inputSplits dengan mengatur mapred.min.split.size
  - #jobs = 1-2
  - #tasks = #inputSplits

Email

BERLANGGANAN FEED RSS

Perlu bantuan lainnya?

Ingin opsi lainnya?

Menemukan Komunitas

Jelajahi manfaat langganan, telusuri kursus pelatihan, pelajari cara mengamankan perangkat Anda, dan banyak lagi.

Keuntungan langganan Microsoft 365

Pelatihan Microsoft 365

Keamanan Microsoft

Pusat aksesibilitas

Komunitas membantu Anda bertanya dan menjawab pertanyaan, memberikan umpan balik, dan mendengar dari para ahli yang memiliki pengetahuan yang luas.

Tanyakan kepada Microsoft Community

Komunitas Teknologi Microsoft

Windows Insider

Microsoft 365 Insider