Applies ToRevolution Analytics

Tamanho do bloco do Windows/Linux

  • Ao escolher o tamanho do bloco, tente selecionar rowsPerRead para produzir ~ 10M elementos de bloco ou menos

    • Com 20 colunas, rowsPerRead = 500e3

    • Com 1000 cols, rowsPerRead = 1000

  • Isso tende a dar um tamanho de bloco, de forma que você pode processar vários blocos por leitura

  • Use o blocksPerRead > 1

    • O valor exato depende de quanta memória RAM você tem disponível

    • Geralmente ter vários blocos na memória ao mesmo tempo melhora o desempenho

  • É fácil aumentar o blocksPerRead, mas caros bloquear novamente, portanto errar por ter blocos menores

  • Se você usar rxSplit() ou rxDataStep() para criar amostras, por exemplo, treinamento/validação e usar rxDataStep() para bloquear novamente de acordo com o princípio anterior

Precisa de mais ajuda?

Quer mais opções

Explore os benefícios da assinatura, procure cursos de treinamento, saiba como proteger seu dispositivo e muito mais.

As comunidades ajudam você a fazer e responder perguntas, fazer comentários e ouvir especialistas com conhecimento avançado.