Pode utilizar as mesmas funções de RevoScaleR para processar grandes conjuntos de dados armazenados no disco, tal como para analisar os pacotes de dados em memória. Isto acontece porque as funções RevoScaleR utilizam algoritmos 'das secções'. Basicamente, das secções algoritmos siga este processo:
-
Inicialização: resultados intermédios necessários para o cálculo das estatísticas finais são inicializados
-
Ler dados: ler um conjunto de dados de (conjunto de observações das variáveis)
-
Transformar dados: efectuar selecções de linha e transformações para o segmento de dados, conforme necessário; escrever dados se apenas a executar o passo de importação ou de dados
-
Processar dados: calcular resultados intermédios para o segmento de dados
-
Actualizar resultados: combinar os resultados do segmento de dados com os dos blocos anteriores
-
Repita os passos 2 - (5) (talvez em paralelo) até que todos os dados ter sido processado
-
Processar resultados: quando os resultados de todos os segmentos foram cumpridos, efectuar cálculos finais e devolver resultados