一般的な Hadoop のパフォーマンスに関する考慮事項 - Microsoft サポート

サポート

サインイン

Microsoft アカウントでサインイン

サインインまたはアカウントを作成してください。

こんにちは、

別のアカウントを選択してください。

複数のアカウントがあります

サインインに使用するアカウントを選択してください。

Revolution Analytics その他...表示数を減らす

一般的な Hadoop のパフォーマンスに関する考慮事項

MapReduce ジョブとタスク

MapReduce で実行されている各スケーラのアルゴリズムを呼び出す 1 つ以上の MapReduce ジョブでは、1 つずつ
各 MapReduce ジョブがマップの 1 つまたは複数のタスクで構成されています
マップのタスクを並列で実行できます。
RxHadoopMR の設定 (... consoleOutput = TRUE が...) ジョブの進行状況を追跡するために

MapReduce ジョブとタスクの拡大/縮小

ランダムフォレスト rxExec (小規模中規模のデータを)
- #jobs = 1
- #tasks = (既定値は 10) nTrees
- ランダムフォレスト (大規模なデータ、例えば 100 GB 以上)
  - #jobs ~ nTrees * maxDepth (既定値は 10 x 10 より小さい、例: 2 x 2 の開始)。
  - #tasks = #inputSplits
- ロジスティック回帰、GLM、k の意味
  - #jobs = #iterations (通常は 4-15 イテレーション)
  - #tasks = #inputSplits
- Mapred.min.split.size を設定することによって、線形回帰、リッジ回帰、rxImportControl #inputSplits
  - #jobs = 1-2
  - #tasks = #inputSplits

メール

RSS フィードを購読する

ヘルプを表示

その他のオプションが必要ですか?

ディスカバーコミュニティ

サブスクリプションの特典の参照、トレーニングコースの閲覧、デバイスのセキュリティ保護方法などについて説明します。

Microsoft 365 サブスクリプションの特典

Microsoft 365 のトレーニング

Microsoft Security

アクセシビリティセンター

コミュニティは、質問をしたり質問の答えを得たり、フィードバックを提供したり、豊富な知識を持つ専門家の意見を聞いたりするのに役立ちます。

Microsoft コミュニティに問い合わせる

Microsoft 技術コミュニティ

Windows Insiders

Microsoft 365 Insiders