您可以使用相同的 RevoScaleR 函式,處理大型資料集一樣來分析記憶體中資料的框架儲存在磁碟上。這是因為 RevoScaleR 函式使用 '區塊' 演算法。基本上,區塊的演算法會遵循此程序︰
-
最終的統計資料的計算所需的中繼結果會初始化初始設定︰
-
讀取資料︰ 讀取的資料區塊 (觀察到的變數集)
-
將資料轉換︰ 執行必要的資料區塊的轉換和資料列選取項目如果只執行匯入] 或 [資料的步驟,寫出資料
-
處理資料︰ 計算的資料區塊的中繼結果
-
更新結果︰ 合併的資料區塊的結果與前一個區塊 (chunk) 的
-
重複步驟 (2)-(5) (可能是以平行方式) 直到所有的資料已被處理。
-
處理結果︰ 已完成從所有區塊 (chunk) 的結果,進行最後的計算,並傳回結果