一般 Hadoop 效能考量 - Microsoft Support

支持

登入

Sign in with Microsoft

Sign in or create an account.

Hello,

Select a different account.

You have multiple accounts

Choose the account you want to sign in with.

Revolution Analytics More...Less

一般 Hadoop 效能考量

MapReduce 作業或工作

在 MapReduce 中執行的每個 ScaleR 演算法會叫用一或多個 MapReduce 的工作，一個接一個
每個 MapReduce 工作是由一或多個對應工作所組成
對應工作可以平行執行
設定 RxHadoopMR (...consoleOutput = TRUE...) 來追蹤作業進度

MapReduce 工作，且工作的縮放比例

隨機樹系與 rxExec （中型資料小）
- #jobs = 1
- #tasks = nTrees （預設值為 10）
- 隨機樹系（大型資料，例如 100 GB +）
  - #jobs ~ nTrees * maxDepth （預設值為 10 x 10; 啟動較小，例如 2 x 2）
  - #tasks = #inputSplits
- 後勤迴歸，GLM，k 方法
  - #jobs = #iterations （通常是 4-15 反覆項目）
  - #tasks = #inputSplits
- 線性迴歸，立體浮凸迴歸，rxImportControl #inputSplits 藉由設定 mapred.min.split.size
  - #jobs = 1-2
  - #tasks = #inputSplits

Email

SUBSCRIBE RSS FEEDS

Need more help?

Want more options?

探索訂閱權益、瀏覽訓練課程、瞭解如何保護您的裝置等等。

Microsoft 365 訂閱權益

Microsoft 365 訓練

Microsoft 安全性

協助工具中心

社群可協助您詢問並回答問題、提供意見反應，以及聆聽來自具有豐富知識的專家意見。

在 Microsoft 社群中提出問題

Microsoft 技術社群

Windows 測試人員

Microsoft 365 測試人員