QA: Como funcionam os algoritmos das secções RevoScaleR?

Pode utilizar as mesmas funções de RevoScaleR para processar grandes conjuntos de dados armazenados no disco, tal como para analisar os pacotes de dados em memória. Isto acontece porque as funções RevoScaleR utilizam algoritmos 'das secções'. Basicamente, das secções algoritmos siga este processo:

Inicialização: resultados intermédios necessários para o cálculo das estatísticas finais são inicializados
Ler dados: ler um conjunto de dados de (conjunto de observações das variáveis)
Transformar dados: efectuar selecções de linha e transformações para o segmento de dados, conforme necessário; escrever dados se apenas a executar o passo de importação ou de dados
Processar dados: calcular resultados intermédios para o segmento de dados
Actualizar resultados: combinar os resultados do segmento de dados com os dos blocos anteriores
Repita os passos 2 - (5) (talvez em paralelo) até que todos os dados ter sido processado
Processar resultados: quando os resultados de todos os segmentos foram cumpridos, efectuar cálculos finais e devolver resultados

QA: Como funcionam os algoritmos das secções RevoScaleR?

Precisa de mais ajuda?

Quer mais opções?

Estas informações foram úteis?

Obrigado pelo seu feedback!