Dôležité informácie o všeobecných Nobotto výkon
MapReduce úlohy a úlohy-
Každý škálovací algoritmus v MapReduce vyvolá jedného alebo viacerých MapReduce úlohy, po jednom
-
Každý MapReduce pozostáva z úloh mapy
-
Mapa úlohy môžete spustiť súčasne
-
Nastavenie RxHadoopMR (... consoleOutput = TRUE...) sledovať priebeh práce
Úloha škálovanie a MapReduce úlohy
-
Náhodné lesa rxExec (malé stredné údaje)
-
#jobs = 1
-
#tasks = nTrees (predvolená hodnota je 10)
-
Náhodné lesa (veľké údaje, napríklad 100 GB +)
-
#jobs ~ nTrees * maxDepth (predvolená hodnota je 10 x 10, spustenie, napríklad 2 x 2)
-
#tasks = #inputSplits
-
-
Logistickej regresie GLM, k-prostriedky
-
#jobs = #iterations (zvyčajne iterácie 4-15)
-
#tasks = #inputSplits
-
-
Lineárny regresie regresie Ridge, rxImportControl #inputSplits nastavenie mapred.min.split.size
-
#jobs = 1-2
-
#tasks = #inputSplits
-
-