Conectați-vă cu Microsoft
Conectați-vă sau creați un cont
Salut,
Selectați un alt cont.
Aveți mai multe conturi
Alegeți contul cu care doriți să vă conectați.

Considerente de performanță generală Hadoop

Activităţilor MapReduce și activități

  • Fiecare algoritm Scala execută în MapReduce invocă unul sau mai multe activităţilor MapReduce, unul după altul

  • Fiecare MapReduce Job constă dintr-una sau mai multe activități hartă

  • Hartă activități poate executa în paralel

  • Setați RxHadoopMR (... consoleOutput = TRUE...) pentru a urmări progresul lucrări

MapReduce Job și activități scalare

  • Random pădure cu rxExec (mici la date medie)

    • #jobs = 1

    • #tasks = nTrees (implicit este 10)

    • Random pădure (mari de date, cum ar fi 100 GB +)

      • #jobs ~ nTrees * maxDepth (implicit este 10 x 10; start mai mici, de ex., 2 x 2)

      • #tasks = #inputSplits

    • Regresie logistic, GLM, k-mijloace

      • #jobs = #iterations (de obicei 4-15 repetări)

      • #tasks = #inputSplits

    • Liniar de regresie, regresie Ridge, rxImportControl #inputSplits prin setarea mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Aveți nevoie de ajutor suplimentar?

Doriți mai multe opțiuni?

Explorați avantajele abonamentului, navigați prin cursurile de instruire, aflați cum să vă securizați dispozitivul și multe altele.

Comunitățile vă ajută să adresați întrebări și să răspundeți la întrebări, să oferiți feedback și să primiți feedback de la experți cu cunoștințe bogate.

Au fost utile aceste informații?

Cât de mulțumit sunteți de calitatea limbajului?
Ce v-a afectat experiența?
Apăsând pe Trimitere, feedbackul dvs. va fi utilizat pentru a îmbunătăți produsele și serviciile Microsoft. Administratorul dvs. IT va avea posibilitatea să colecteze aceste date. Angajamentul de respectare a confidențialității.

Vă mulțumim pentru feedback!

×