Gäller för
Revolution Analytics

Windows/Linux blockstorlek

  • När du väljer blockstorlek försök markera rowsPerRead att ge ~ 10M element i blocket, eller ännu mindre

    • Med 20 kolumner, rowsPerRead = 500e3

    • Med 1000 cols, rowsPerRead = 1000

  • Detta tenderar att ge en blockstorlek så att du kan bearbeta flera block per läsning

  • Använd blocksPerRead > 1

    • Det exakta värdet beror på hur mycket RAM-minne du har tillgängliga

    • I allmänhet har flera block i minnet samtidigt förbättrar prestanda

  • Det är lätt att öka blocksPerRead, men dyrt att blockera igen, så ta till en viss med mindre block

  • Om du använder rxSplit() eller rxDataStep() för att skapa prov, t.ex. utbildning/validering och sedan använda rxDataStep() att blockera igen enligt principen som tidigare

Behöver du mer hjälp?

Vill du ha fler alternativ?

Utforska prenumerationsförmåner, bläddra bland utbildningskurser, lär dig hur du skyddar din enhet med mera.