Stejné funkce RevoScaleR můžete použít ke zpracování velké datové sady uložené na disku, stejně jako při analýze dat v paměti rámců. Je to proto, že "bloků" algoritmy pomocí funkce RevoScaleR. V podstatě bloků algoritmy řídí tímto postupem:

  1. Inicializace: průběžné výsledky potřebné pro výpočet konečné statistiky jsou inicializovány.

  2. Čtení dat: čtení bloku dat (sada pozorování proměnných)

  3. Transformace dat: provedení transformace a výběrů řádku bloku dat podle potřeby; Pokud pouze provedením kroku importu nebo data zapsat data

  4. Zpracování dat: vypočítat průběžné výsledky k bloku dat dat

  5. Aktualizovat výsledky: kombinuje výsledky z bloku dat data s těmi předchozí bloky

  6. Opakujte kroky 2 - (5) (možná paralelně) dokud všechna data byla zpracována.

  7. Zpracování výsledků: dokončení výsledky ze všech bloků proveďte závěrečné vyúčtování a vrátit výsledky

Potřebujete další pomoc?

Chcete další možnosti?

Prozkoumejte výhody předplatného, projděte si školicí kurzy, zjistěte, jak zabezpečit své zařízení a mnohem více.

Komunity vám pomohou klást otázky a odpovídat na ně, poskytovat zpětnou vazbu a vyslechnout odborníky s bohatými znalostmi.