Inställning av skogen och ökat trädet förutsägelse hastighet på Hadoop

Skogen och ökat trädet förutsägelse hastighet på Hadoop

  • Som standard startar rxPredict MR jobb per träd för att minska minnesanvändningen

  • Anropa rxPredict inuti rxExec för smallish datauppsättningar, eller ange scheduleOnce = TRUE (i 7.3) om du vill minska tidsplaneringen overhead

– rxPredict (dforestObject, data = myData, outData = myOutData scheduleOnce = TRUE,...)

  • Ange scheduleOnce för större datauppsättningar = 1 för att göra prognoser parallellt med ett enda utskriftsjobb MR (tillgänglig i 7.3, internt använder rxDataStep för att anropa predict.randomForest; kräver randomForest-paket)

– rxPredict (dforestObject, data = myData, outData = myOutData scheduleOnce = 1,...

Behöver du mer hjälp?

Utöka dina kunskaper
Utforska utbildning
Få nya funktioner först
Anslut till Microsoft Insiders

Hade du nytta av den här informationen?

Tack för din feedback!

Tack för din feedback! Det låter som att det kan vara bra att koppla dig till en av våra Office-supportrepresentanter.

×