Перейти к основному контенту
Поддержка
Войдите с помощью учетной записи Майкрософт
Войдите или создайте учетную запись.
Здравствуйте,
Выберите другую учетную запись.
У вас несколько учетных записей
Выберите учетную запись, с помощью которой нужно войти.

Hadoop общие вопросы производительности

MapReduce заданий и задач

  • Каждый алгоритм проекционная в MapReduce вызывает одно или несколько заданий MapReduce, один за другим

  • Каждое задание MapReduce состоит из одной или нескольких задач карты

  • Карта задач могут выполняться параллельно

  • Значение RxHadoopMR (... consoleOutput = TRUE...) для отслеживания хода выполнения работ

Задания MapReduce и масштабирование задачи

  • Случайная лес с rxExec (малых и средних данных)

    • #jobs = 1

    • #tasks = nTrees (по умолчанию — 10)

    • Случайная леса (большой объем данных, например 100 ГБ +)

      • #jobs ~ nTrees * maxDepth (по умолчанию — 10 x 10; запуск меньшего размера, например 2 x 2)

      • #tasks = #inputSplits

    • Алгоритм логистической регрессии, GLM, k среднее

      • #jobs = #iterations (обычно итерации 4-15)

      • #tasks = #inputSplits

    • Линейной регрессии, ребра регрессии, rxImportControl #inputSplits, установив mapred.min.split.size

      • #jobs = 1-2

      • #tasks = #inputSplits

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Изучите преимущества подписки, просмотрите учебные курсы, узнайте, как защитить свое устройство и т. д.

В сообществах можно задавать вопросы и отвечать на них, отправлять отзывы и консультироваться с экспертами разных профилей.

Были ли сведения полезными?

Насколько вы удовлетворены качеством перевода?
Что повлияло на вашу оценку?
После нажатия кнопки "Отправить" ваш отзыв будет использован для улучшения продуктов и служб Майкрософт. Эти данные будут доступны для сбора ИТ-администратору. Заявление о конфиденциальности.

Спасибо за ваш отзыв!

×