Gjelder for
Revolution Analytics

Skog og Boosted treet forutsigelse hastighet på Hadoop

  • Som standard starter rxPredict en MR jobb per treet for å minimere minnebruk

  • Ring rxPredict i rxExec for smallish datasett, eller angi scheduleOnce = TRUE (i 7.3) for å redusere planleggingen indirekte

– rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = TRUE,...)

  • For større datasett, kan du angi scheduleOnce = 1 for å gjøre forutsigelse parallelt med en enkelt jobb MR (tilgjengelig i 7.3; internt, bruker rxDataStep til å kalle predict.randomForest; krever randomForest-pakke)

– rxPredict (dforestObject, data = myData, outData = myOutData, scheduleOnce = 1,...

Trenger du mer hjelp?

Vil du ha flere alternativer?

Utforsk abonnementsfordeler, bla gjennom opplæringskurs, finn ut hvordan du sikrer enheten og mer.