Applies ToRevolution Analytics

Ukuran blok Windows Linux

  • Ketika memilih ukuran blok, cobalah untuk memilih rowsPerRead untuk menghasilkan ~ 10M elemen dalam blok, atau bahkan kurang

    • Dengan kolom 20, rowsPerRead = 500e3

    • Dengan 1000 cols, rowsPerRead = 1000

  • Ini cenderung memberikan ukuran blok sedemikian rupa sehingga Anda dapat diproses oleh beberapa blok per dibaca

  • Menggunakan blocksPerRead > 1

    • Nilai yang tepat tergantung pada berapa banyak RAM telah tersedia

    • Biasanya memiliki beberapa blok di memori secara bersamaan meningkatkan kinerja

  • Mudah untuk meningkatkan blocksPerRead, tetapi murah untuk memblokir kembali, jadi err samping memiliki blok yang lebih kecil

  • Jika Anda menggunakan rxSplit() atau rxDataStep() untuk membuat contoh, misalnya pelatihan validasi, kemudian gunakan rxDataStep() ulang memblokir berdasarkan prinsip sebelumnya

Perlu bantuan lainnya?

Ingin opsi lainnya?

Jelajahi manfaat langganan, telusuri kursus pelatihan, pelajari cara mengamankan perangkat Anda, dan banyak lagi.

Komunitas membantu Anda bertanya dan menjawab pertanyaan, memberikan umpan balik, dan mendengar dari para ahli yang memiliki pengetahuan yang luas.