Prisijunkite prie „Microsoft“
Prisijunkite arba sukurkite paskyrą.
Sveiki,
Pasirinkti kitą paskyrą.
Turite kelias paskyras
Pasirinkite paskyrą, kurią naudodami norite prisijungti.

Bendrasis Hadoop efektyvumo klausimai

MapReduce užduočių vykdymas ir užduotys

  • Kiekvienas skaleris algoritmas veikia MapReduce nurodo vieną arba kelis MapReduce užduočių vykdymas, vienas po kito

  • Kiekvienas MapReduce užduočių sudaro viena ar kelios žemėlapyje užduotys

  • Žemėlapyje užduotis gali vykdyti tuo pačiu metu

  • Nustatyti RxHadoopMR (... consoleOutput = TRUE...) darbo eigos stebėjimas

MapReduce darbų ir užduočių pritaikymas

  • Atsitiktinis miško su rxExec (mažų ir vidutinių duomenų)

    • #jobs = 1

    • #tasks = nTrees (numatytasis parametras yra 10)

    • Atsitiktinis miško (didelės apimties duomenys, pvz. 100 GB +)

      • #jobs ~ nTrees * maxDepth (numatytasis parametras yra 10 x 10, paleiskite mažesnis, pvz., 2 x 2)

      • #tasks = #inputSplits

    • Logistika regresijos, GLM, k-priemonės

      • #jobs = #iterations (paprastai 4-15 iteracijas)

      • #tasks = #inputSplits

    • Linijinė regresinė, Ridge regresijos, rxImportControl #inputSplits nustatydami mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Reikia daugiau pagalbos?

Norite daugiau parinkčių?

Sužinokite apie prenumeratos pranašumus, peržiūrėkite mokymo kursus, sužinokite, kaip apsaugoti savo įrenginį ir kt.

Bendruomenės padeda užduoti klausimus ir į juos atsakyti, pateikti atsiliepimų ir išgirsti iš ekspertų, turinčių daug žinių.

Ar ši informacija buvo naudinga?

Ar esate patenkinti kalbos kokybe?
Kas turėjo įtakos jūsų įspūdžiams?
Paspaudus mygtuką Pateikti, jūsų atsiliepimai bus naudojami tobulinant „Microsoft“ produktus ir paslaugas. Jūsų IT administratorius galės rinkti šiuos duomenis. Privatumo patvirtinimas.

Dėkojame už jūsų atsiliepimą!

×