Prisijunkite prie „Microsoft“
Prisijunkite arba sukurkite paskyrą.
Sveiki,
Pasirinkti kitą paskyrą.
Turite kelias paskyras
Pasirinkite paskyrą, kurią naudodami norite prisijungti.

Sudėtinis Hadoop XDF bloko dydis

MapReduce padalijamas kiekvieną įvesties teksto failą į vieną arba kelis įvesties įskilimų, kuri pagal numatytuosius nustatymus yra HDFS bloko dydis, pvz., 128 MB

  • Kiekvienos įvesties perskyrimo pakeičiamas iš nesuglaudinto, unparsed tekstą į suglaudintą ir analizuotos išvestį, išvesties katalogo – antraštės informaciją xdfd's rinkiniui "duomenys" pakatalogyje xdfd dvejetainis failas yra viename xdfm metaduomenų faile "metaduomenys" kataloge

  • Vėliau analizės efektyvumą, kiekvieną failą, išvesties xdfd maždaug turi atitikti HDFS bloko dydis

  • Atlyginti XDF glaudinimas, todėl paprastai reikia padidinti xdfd išvesties failo dydis daugiau įvesties perskirti naudojant šį parametrą kaip RxHadoopMR():

    • hadoopSwitches="-Dmapred.min.split.size=1000000000"

    • Neseniai Hadoop įrenginių naudojant YARN, parametras yra mapreduce.input.fileinputformat.split.minsize

  • Įvesties perskirti dydis dar labiau didėja gali sumažinti sudėtinis XDF failų skaičių ir todėl parallelized žemėlapyje skaičius užduotis vėliau analizės. Tai gali būti naudinga, jei žemėlapio vietas arba konteinerių skaičius yra nedidelis palyginus padalija skaičių. Priešingai, daugelis susieti vietas arba talpyklos, mažesnis įvesties funkcija padalina ir daugiau xdfd gali sukelti greičiau užbaigti.

  • Pvz.

Importavimas įvesties CSV, 670 MB Hortonworks Sandbox numatytoji įvesties perskirti dydis (32MB) sukurtas 670/32 = 21 xdfd su rxSummary kokybė, 185".  Įvesties perskyrimo didėjantys 150MB sukurtas 5 xdfd's kiekvienas apie 32MB su rxSummary kokybė, 68".

rxSetComputeContext (RxHadoopMR(hadoopSwitches =

        "-Dmapreduce.input.fileinputformat.split.minsize=150000000"))

rxImport (myCSV, myCXdf, perrašyti = TRUE)

jį atgal, kai baigsite rxSetComputeContext(RxHadoopMR()) # rinkinys

Reikia daugiau pagalbos?

Norite daugiau parinkčių?

Sužinokite apie prenumeratos pranašumus, peržiūrėkite mokymo kursus, sužinokite, kaip apsaugoti savo įrenginį ir kt.

Bendruomenės padeda užduoti klausimus ir į juos atsakyti, pateikti atsiliepimų ir išgirsti iš ekspertų, turinčių daug žinių.

Ar ši informacija buvo naudinga?

Ar esate patenkinti kalbos kokybe?
Kas turėjo įtakos jūsų įspūdžiams?
Paspaudus mygtuką Pateikti, jūsų atsiliepimai bus naudojami tobulinant „Microsoft“ produktus ir paslaugas. Jūsų IT administratorius galės rinkti šiuos duomenis. Privatumo patvirtinimas.

Dėkojame už jūsų atsiliepimą!

×