Considerente de performanță generală Hadoop

Asistență

Conectare

Conectați-vă cu Microsoft

Conectați-vă sau creați un cont

Salut,

Selectați un alt cont.

Aveți mai multe conturi

Alegeți contul cu care doriți să vă conectați.

Revolution Analytics Mai multe...Mai puțin

Considerente de performanță generală Hadoop

Activităţilor MapReduce și activități

Fiecare algoritm Scala execută în MapReduce invocă unul sau mai multe activităţilor MapReduce, unul după altul
Fiecare MapReduce Job constă dintr-una sau mai multe activități hartă
Hartă activități poate executa în paralel
Setați RxHadoopMR (... consoleOutput = TRUE...) pentru a urmări progresul lucrări

MapReduce Job și activități scalare

Random pădure cu rxExec (mici la date medie)
- #jobs = 1
- #tasks = nTrees (implicit este 10)
- Random pădure (mari de date, cum ar fi 100 GB +)
  - #jobs ~ nTrees * maxDepth (implicit este 10 x 10; start mai mici, de ex., 2 x 2)
  - #tasks = #inputSplits
- Regresie logistic, GLM, k-mijloace
  - #jobs = #iterations (de obicei 4-15 repetări)
  - #tasks = #inputSplits
- Liniar de regresie, regresie Ridge, rxImportControl #inputSplits prin setarea mapred.min.split.size
  - #jobs = 1-2
  - #tasks = #inputSplits

ABONAȚI-VĂ LA FLUXURI RSS

Aveți nevoie de ajutor suplimentar?

Doriți mai multe opțiuni?

Descoperiți Comunitate

Explorați avantajele abonamentului, navigați prin cursurile de instruire, aflați cum să vă securizați dispozitivul și multe altele.

Beneficiile abonamentului Microsoft 365

Instruire Microsoft 365

Securitate Microsoft

Centru de accesibilitate

Comunitățile vă ajută să adresați întrebări și să răspundeți la întrebări, să oferiți feedback și să primiți feedback de la experți cu cunoștințe bogate.

Întrebați Comunitatea Microsoft

Comunitatea tehnică Microsoft

Utilizatorii Windows Insider

Utilizatori Insider Microsoft 365

Considerente de performanță generală Hadoop

Aveți nevoie de ajutor suplimentar?

Doriți mai multe opțiuni?

Au fost utile aceste informații?

Vă mulțumim pentru feedback!