RevoScaleR formler støtter to formel funksjoner for å konvertere categorical variabler:
N() behandler en categorical variabel som kontinuerlig. F() behandler en kontinuerlig variabel som categorical. F() inneholder flere argumenter lav, høy eller Utelat, som kan være inkludert for å angi verdien til den laveste kategorien, høyest kategori og hvordan du vil håndtere verdier utenfor det angitte området. I dette eksemplet, som bruker utvalg Census Data leveres med RevoScaleR, brukes F() ganske enkelt for å behandle variabelen "alder" som en faktor i formelen sammendrag:sampleDataDir <- rxGetOption("sampleDataDir") censusWorkers <- file.path(sampleDataDir, "CensusWorkers.xdf")
rxSummary(~ F(age) + sex, data = censusWorkers)
Hvis du vil ha mer informasjon om RevoScaleR formelsyntaks, skriver? rxFormula på revolusjon R Enterprise-konsollen.