Pierakstīties, izmantojot Microsoft
Pierakstīties vai izveidot kontu
Sveicināti!
Atlasīt citu kontu.
Jums ir vairāki konti
Izvēlieties kontu, ar kuru vēlaties pierakstīties.

Vispārīga Hadoop veiktspējas apsvērumi

MapReduce darbi un uzdevumi

  • Katru darbību MapReduce ScaleR algoritms izsauc vienu vai vairākus MapReduce darbi viens pēc otra

  • Katra MapReduce darba veido vienu vai vairākus uzdevumus karte

  • Vienlaikus var izpildīt karti uzdevumi

  • Iestatiet RxHadoopMR (… consoleOutput = TRUE...) izsekot darba norises

MapReduce darbu un uzdevumu mērogošana

  • Nejaušs mežā ar rxExec (mazā vidējā dati)

    • #jobs = 1

    • #tasks = nTrees (noklusējums ir 10)

    • Nejaušs meža (lieli dati, piemēram 100 GB +)

      • #jobs ~ nTrees * maxDepth (noklusējums ir 10 x 10; sākt samazināt, piemēram, 2. x 2)

      • #tasks = #inputSplits

    • Loģistiskā regresijas GLM, k-līdzekļi

      • #jobs = #iterations (parasti 4 15 atkārtojumi)

      • #tasks = #inputSplits

    • Lineāra regresijas grēda regresijas rxImportControl #inputSplits, nosakot mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Nepieciešama papildu palīdzība?

Vēlaties vairāk opciju?

Izpētiet abonementa priekšrocības, pārlūkojiet apmācības kursus, uzziniet, kā aizsargāt ierīci un veikt citas darbības.

Kopienas palīdz uzdot jautājumus un atbildēt uz tiem, sniegt atsauksmes, kā arī saņemt informāciju no ekspertiem ar bagātīgām zināšanām.

Vai šī informācija bija noderīga?

Cik lielā mērā esat apmierināts ar valodas kvalitāti?
Kas ietekmēja jūsu pieredzi?
Nospiežot Iesniegt, jūsu atsauksmes tiks izmantotas Microsoft produktu un pakalpojumu uzlabošanai. Jūsu IT administrators varēs vākt šos datus. Paziņojums par konfidencialitāti.

Paldies par jūsu atsauksmēm!

×