Applies ToRevolution Analytics

Tamanho do bloco Windows/Linux

  • Quando escolher o tamanho do bloco, tente seleccionar rowsPerRead para produzir elementos ~ 10M em bloco ou até menos

    • As 20 colunas, rowsPerRead = 500e3

    • Com 1000 cols, rowsPerRead = 1000

  • Esta interpretação tende a dar um tamanho de bloco que pode processar vários blocos por leitura

  • Utilize blocksPerRead > 1

    • O valor exacto depende da quantidade de RAM disponível

    • Geralmente, ter simultaneamente vários blocos na memória melhora o desempenho

  • É fácil aumentar a blocksPerRead, mas dispendiosa bloquear novamente, assim uma questão de precaução tendo blocos inferiores

  • Se utilizar rxSplit() ou rxDataStep() para criar amostras, por exemplo, formação/validação, em seguida, utilizar rxDataStep() para bloquear novamente segundo o princípio anterior

Precisa de mais ajuda?

Quer mais opções?

Explore os benefícios da subscrição, navegue em cursos de formação, saiba como proteger o seu dispositivo e muito mais.

As comunidades ajudam-no a colocar e a responder perguntas, a dar feedback e a ouvir especialistas com conhecimentos abrangentes.