メイン コンテンツへスキップ
サポート
Microsoft アカウントでサインイン
サインインまたはアカウントを作成してください。
こんにちは、
別のアカウントを選択してください。
複数のアカウントがあります
サインインに使用するアカウントを選択してください。

一般的な Hadoop のパフォーマンスに関する考慮事項

MapReduce ジョブとタスク

  • MapReduce で実行されている各スケーラのアルゴリズムを呼び出す 1 つ以上の MapReduce ジョブでは、1 つずつ

  • 各 MapReduce ジョブがマップの 1 つまたは複数のタスクで構成されています

  • マップのタスクを並列で実行できます。

  • RxHadoopMR の設定 (... consoleOutput = TRUE が...) ジョブの進行状況を追跡するために

MapReduce ジョブとタスクの拡大/縮小

  • ランダム フォレスト rxExec (小規模中規模のデータを)

    • #jobs = 1

    • #tasks = (既定値は 10) nTrees

    • ランダム フォレスト (大規模なデータ、例えば 100 GB 以上)

      • #jobs ~ nTrees * maxDepth (既定値は 10 x 10 より小さい、例: 2 x 2 の開始)。

      • #tasks = #inputSplits

    • ロジスティック回帰、GLM、k の意味

      • #jobs = #iterations (通常は 4-15 イテレーション)

      • #tasks = #inputSplits

    • Mapred.min.split.size を設定することによって、線形回帰、リッジ回帰、rxImportControl #inputSplits

      • #jobs = 1-2

      • #tasks = #inputSplits

ヘルプを表示

その他のオプションが必要ですか?

サブスクリプションの特典の参照、トレーニング コースの閲覧、デバイスのセキュリティ保護方法などについて説明します。

コミュニティは、質問をしたり質問の答えを得たり、フィードバックを提供したり、豊富な知識を持つ専門家の意見を聞いたりするのに役立ちます。

この情報は役に立ちましたか?

言語の品質にどの程度満足していますか?
どのような要因がお客様の操作性に影響しましたか?
[送信] を押すと、Microsoft の製品とサービスの改善にフィードバックが使用されます。 IT 管理者はこのデータを収集できます。 プライバシーに関する声明。

フィードバックをいただき、ありがとうございます。

×