Applies ToRevolution Analytics

Skogen och ökat trädet förutsägelse hastighet på Hadoop

  • Som standard startar rxPredict MR jobb per träd för att minska minnesanvändningen

  • Anropa rxPredict inuti rxExec för smallish datauppsättningar, eller ange scheduleOnce = TRUE (i 7.3) om du vill minska tidsplaneringen overhead

– rxPredict (dforestObject, data = myData, outData = myOutData scheduleOnce = TRUE,...)

  • Ange scheduleOnce för större datauppsättningar = 1 för att göra prognoser parallellt med ett enda utskriftsjobb MR (tillgänglig i 7.3, internt använder rxDataStep för att anropa predict.randomForest; kräver randomForest-paket)

– rxPredict (dforestObject, data = myData, outData = myOutData scheduleOnce = 1,...

Behöver du mer hjälp?

Vill du ha fler alternativ?

Utforska prenumerationsförmåner, bläddra bland utbildningskurser, lär dig hur du skyddar din enhet med mera.

Communities hjälper dig att ställa och svara på frågor, ge feedback och få råd från experter med rika kunskaper.