Formler för RevoScaleR stöder två formeln funktioner för konvertering av nedbrytning variabler:
N() behandlar en kategorisk variabel som kontinuerlig.
F() behandlar en kontinuerlig variabel som kategorisk.
F() innehåller ytterligare argument låg, hög och undanta kan ingå att ange värdet för den lägsta kategorin, den högsta kategorin och hur du vill hantera värden utanför det angivna intervallet.
I detta exempel som använder provet inventering Data levereras med RevoScaleR, används bara F() för att behandla variabeln "ålder" som en faktor i sammanfattning formeln:
sampleDataDir <- rxGetOption("sampleDataDir") censusWorkers <- file.path(sampleDataDir, "CensusWorkers.xdf")
rxSummary(~ F(age) + sex, data = censusWorkers)
Mer information om RevoScaleR-formelsyntax skriver? rxFormula vid revolutionen R Enterprise console.