Applies ToRevolution Analytics

Windows/Linux 區塊大小

  • 當選擇區塊的大小,請試著選取 rowsPerRead,以產生 ~ 10 M 中的區塊,或甚至更少的項目

    • 20 個資料行,rowsPerRead = 500e3

    • 具有 1000 cols,rowsPerRead = 1000年

  • 這通常會將提供區塊大小,如此您就可以處理多個區塊,每次讀取

  • 使用 blocksPerRead > 1

    • 確實的值取決於多少 RAM 可用

    • 通常同時在記憶體中有多個區塊可以改善效能

  • 很容易就能增加 blocksPerRead,但是也非常昂貴重新封鎖,所以也不要放鬆有較小的區塊

  • 如果您是使用 rxSplit() 或 rxDataStep() 來建立範例,例如訓練/驗證,然後使用 rxDataStep() 重新封鎖根據先前的原則

Need more help?

Want more options?

探索訂閱權益、瀏覽訓練課程、瞭解如何保護您的裝置等等。

社群可協助您詢問並回答問題、提供意見反應,以及聆聽來自具有豐富知識的專家意見。