RevoScaleR formuły obsługują dwie funkcje formuły do konwersji zmiennych kategorii:
N() traktuje kategorii zmienną jako ciągłe.
F() traktuje zmienną ciągłą jak kategorii.
F() zawiera dodatkowe argumenty niski, wysoki i wykluczania, które można dołączyć do określenia wartości najniższej kategorii, o najwyższej kategorii i sposobu obsługi wartości spoza podanego zakresu.
Ten przykład, który używa próbki, którego dostarczone dane spisu z RevoScaleR, po prostu używa F() w leczeniu zmiennej "wiek" jako czynnika formułę podsumowania:
sampleDataDir <- rxGetOption("sampleDataDir") censusWorkers <- file.path(sampleDataDir, "CensusWorkers.xdf")
rxSummary(~ F(age) + sex, data = censusWorkers)
Aby uzyskać więcej informacji o składni formuły RevoScaleR, wpisz? rxFormula w konsoli Rewolucji R przedsiębiorstwa.