Considerações sobre o desempenho geral Hadoop - Suporte da Microsoft

Suporte

Entrar

Entrar com a conta da Microsoft

Entrar ou criar uma conta.

Olá,

Selecionar uma conta diferente.

Você tem várias contas

Escolha a conta com a qual você deseja entrar.

Revolution Analytics Mais...Menos

Considerações sobre o desempenho geral Hadoop

MapReduce trabalhos e tarefas

Cada algoritmo ScaleR executando o MapReduce invoca um ou mais trabalhos de MapReduce, um após o outro
Cada MapReduce Job consiste em uma ou mais tarefas de mapa
Mapa de tarefas podem executar em paralelo
Definir RxHadoopMR (... consoleOutput = TRUE...) para controlar o andamento do trabalho

Trabalho MapReduce e dimensionamento de tarefa

Floresta de Random com rxExec (pequena ou médios dados)
- #jobs = 1
- #tasks = nTrees (o padrão é 10)
- Floresta de Random (grandes dados, por exemplo, 100 GB +)
  - #jobs ~ nTrees * maxDepth (o padrão é 10 x 10; iniciar menor, por exemplo 2 x 2)
  - #tasks = #inputSplits
- Regressão logística, GLM, k-Means
  - #jobs = #iterations (normalmente iterações de 4-15)
  - #tasks = #inputSplits
- RxImportControl linear regressão, Montanhas de regressão, #inputSplits, definindo mapred.min.split.size
  - #jobs = 1-2
  - #tasks = #inputSplits

Email

ASSINAR RSS FEEDS

Precisa de mais ajuda?

Quer mais opções

Descobrir Comunidade

Explore os benefícios da assinatura, procure cursos de treinamento, saiba como proteger seu dispositivo e muito mais.

Benefícios da assinatura do Microsoft 365

Treinamento do Microsoft 365

Segurança da Microsoft

Centro de acessibilidade

As comunidades ajudam você a fazer e responder perguntas, fazer comentários e ouvir especialistas com conhecimento avançado.

Perguntar à comunidade da Microsoft

Microsoft Tech Community

Windows Insiders

Insiders do Microsoft 365