同じの RevoScaleR 関数を使用するには非常に大きなデータ セットがメモリ内のデータのフレームを分析するのににはディスクに保存を処理します。RevoScaleR 関数は、'の ' チャンクのアルゴリズムを使用するためです。基本的には、このプロセスに従いチャンクのアルゴリズム。
-
初期化: 中間結果の最終的な統計情報の計算に必要な初期化します。
-
データの読み取り: 読み取りデータのチャンク (変数の観測値のセット)
-
データを変換する: 必要に応じてデータのチャンクの変換、および行の選択を実行インポートまたはデータの手順を実行するだけの場合は、データを書き出す
-
データ処理: チャンク データの中間結果を計算します。
-
結果を更新します: 前のチャンクのデータのチャンクから結果を結合します。
-
手順を繰り返します (2)-(5) などに (並行して) までのすべてのデータが処理されています。
-
結果の処理: すべてのチャンクからの結果が完了したら、最終的な計算を行うし、返す結果