Microsoft로 로그인
로그인하거나 계정을 만듭니다.
안녕하세요.
다른 계정을 선택합니다.
계정이 여러 개 있음
로그인할 계정을 선택합니다.

일반 Hadoop 성능 고려 사항

MapReduce 작업 및 작업

  • MapReduce를 실행 하는 각 ScaleR 알고리즘 호출 MapReduce 작업을 여러 차례

  • 하나 이상의 맵 작업 이루어져 있으며 각 MapReduce 작업

  • 지도 작업은 병렬로 실행할 수 있습니다

  • RxHadoopMR 설정 (... consoleOutput = TRUE) 작업 진행 상황을 관리

MapReduce 작업 및 작업 조정

  • (보통 데이터 소) rxExec 사용 하 여 Random 포리스트

    • #jobs = 1

    • #tasks = nTrees (기본값은 10)

    • 임의 포리스트 (대용량 데이터, 예: 100 GB +)

      • #jobs ~ nTrees * maxDepth (기본값은 10 x 10, 시작, 예: 2 x 2)

      • #tasks = #inputSplits

    • 로지스틱 회귀, GLM, k-수단

      • #jobs = #iterations (일반적으로 4-15 반복)

      • #tasks = #inputSplits

    • Mapred.min.split.size를 설정 하 여 선형 회귀, 볼록 회귀 rxImportControl #inputSplits

      • #jobs = 1-2

      • #tasks = #inputSplits

도움이 더 필요하세요?

더 많은 옵션을 원하세요?

구독 혜택을 살펴보고, 교육 과정을 찾아보고, 디바이스를 보호하는 방법 등을 알아봅니다.

커뮤니티를 통해 질문하고 답변하고, 피드백을 제공하고, 풍부한 지식을 갖춘 전문가의 의견을 들을 수 있습니다.

이 정보가 유용한가요?

언어 품질에 얼마나 만족하시나요?
사용 경험에 어떠한 영향을 주었나요?
제출을 누르면 피드백이 Microsoft 제품과 서비스를 개선하는 데 사용됩니다. IT 관리자는 이 데이터를 수집할 수 있습니다. 개인정보처리방침

의견 주셔서 감사합니다!

×