Applies ToRevolution Analytics

Dôležité informácie o všeobecných Nobotto výkonMapReduce úlohy a úlohy

  • Každý škálovací algoritmus v MapReduce vyvolá jedného alebo viacerých MapReduce úlohy, po jednom

  • Každý MapReduce pozostáva z úloh mapy

  • Mapa úlohy môžete spustiť súčasne

  • Nastavenie RxHadoopMR (... consoleOutput = TRUE...) sledovať priebeh práce

Úloha škálovanie a MapReduce úlohy

  • Náhodné lesa rxExec (malé stredné údaje)

    • #jobs = 1

    • #tasks = nTrees (predvolená hodnota je 10)

    • Náhodné lesa (veľké údaje, napríklad 100 GB +)

      • #jobs ~ nTrees * maxDepth (predvolená hodnota je 10 x 10, spustenie, napríklad 2 x 2)

      • #tasks = #inputSplits

    • Logistickej regresie GLM, k-prostriedky

      • #jobs = #iterations (zvyčajne iterácie 4-15)

      • #tasks = #inputSplits

    • Lineárny regresie regresie Ridge, rxImportControl #inputSplits nastavenie mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Potrebujete ďalšiu pomoc?

Chcete ďalšie možnosti?

Môžete preskúmať výhody predplatného, prehľadávať školiace kurzy, naučiť sa zabezpečiť svoje zariadenie a ešte oveľa viac.

Komunity pomôžu s kladením otázok a odpovedaním na ne, s poskytovaním pripomienok a so získavaním informácií od odborníkov s bohatými znalosťami.