Attiecas uz
Revolution Analytics

Vispārīga Hadoop veiktspējas apsvērumiMapReduce darbi un uzdevumi

  • Katru darbību MapReduce ScaleR algoritms izsauc vienu vai vairākus MapReduce darbi viens pēc otra

  • Katra MapReduce darba veido vienu vai vairākus uzdevumus karte

  • Vienlaikus var izpildīt karti uzdevumi

  • Iestatiet RxHadoopMR (… consoleOutput = TRUE...) izsekot darba norises

MapReduce darbu un uzdevumu mērogošana

  • Nejaušs mežā ar rxExec (mazā vidējā dati)

    • #jobs = 1

    • #tasks = nTrees (noklusējums ir 10)

    • Nejaušs meža (lieli dati, piemēram 100 GB +)

      • #jobs ~ nTrees * maxDepth (noklusējums ir 10 x 10; sākt samazināt, piemēram, 2. x 2)

      • #tasks = #inputSplits

    • Loģistiskā regresijas GLM, k-līdzekļi

      • #jobs = #iterations (parasti 4 15 atkārtojumi)

      • #tasks = #inputSplits

    • Lineāra regresijas grēda regresijas rxImportControl #inputSplits, nosakot mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Nepieciešama papildu palīdzība?

Vēlaties vairāk opciju?

Izpētiet abonementa priekšrocības, pārlūkojiet apmācības kursus, uzziniet, kā aizsargāt ierīci un veikt citas darbības.