RevoScaleR formler støtter to formel funksjoner for å konvertere categorical variabler:N() behandler en categorical variabel som kontinuerlig.F() behandler en kontinuerlig variabel som categorical.F() inneholder flere argumenter lav, høy eller Utelat, som kan være inkludert for å angi verdien til den laveste kategorien, høyest kategori og hvordan du vil håndtere verdier utenfor det angitte området.I dette eksemplet, som bruker utvalg Census Data leveres med RevoScaleR, brukes F() ganske enkelt for å behandle variabelen "alder" som en faktor i formelen sammendrag:
sampleDataDir <- rxGetOption("sampleDataDir") censusWorkers <- file.path(sampleDataDir, "CensusWorkers.xdf") rxSummary(~ F(age) + sex, data = censusWorkers)
Hvis du vil ha mer informasjon om RevoScaleR formelsyntaks, skriver? rxFormula på revolusjon R Enterprise-konsollen.