일반 Hadoop 성능 고려 사항 - Microsoft 지원

고객 지원

로그인

Microsoft로 로그인

로그인하거나 계정을 만듭니다.

안녕하세요.

다른 계정을 선택합니다.

계정이 여러 개 있음

로그인할 계정을 선택합니다.

Revolution Analytics 더 보기...간단히

일반 Hadoop 성능 고려 사항

MapReduce 작업 및 작업

MapReduce를 실행 하는 각 ScaleR 알고리즘 호출 MapReduce 작업을 여러 차례
하나 이상의 맵 작업 이루어져 있으며 각 MapReduce 작업
지도 작업은 병렬로 실행할 수 있습니다
RxHadoopMR 설정 (... consoleOutput = TRUE) 작업 진행 상황을 관리

MapReduce 작업 및 작업 조정

(보통 데이터 소) rxExec 사용 하 여 Random 포리스트
- #jobs = 1
- #tasks = nTrees (기본값은 10)
- 임의 포리스트 (대용량 데이터, 예: 100 GB +)
  - #jobs ~ nTrees * maxDepth (기본값은 10 x 10, 시작, 예: 2 x 2)
  - #tasks = #inputSplits
- 로지스틱 회귀, GLM, k-수단
  - #jobs = #iterations (일반적으로 4-15 반복)
  - #tasks = #inputSplits
- Mapred.min.split.size를 설정 하 여 선형 회귀, 볼록 회귀 rxImportControl #inputSplits
  - #jobs = 1-2
  - #tasks = #inputSplits

전자 메일

RSS 피드 구독

도움이 더 필요하세요?

더 많은 옵션을 원하세요?

검색 커뮤니티

구독 혜택을 살펴보고, 교육 과정을 찾아보고, 디바이스를 보호하는 방법 등을 알아봅니다.

Microsoft 365 구독 혜택

Microsoft 365 교육

Microsoft 보안

접근성 센터

커뮤니티를 통해 질문하고 답변하고, 피드백을 제공하고, 풍부한 지식을 갖춘 전문가의 의견을 들을 수 있습니다.

Microsoft 커뮤니티에 질문하기

Microsoft Tech Community

Windows 참가자

Microsoft 365 참가자