Formules de RevoScaleR prend en charge deux fonctions de formule pour convertir des variables par catégorie :
N() traite une variable catégorique comme continue.
F() traite une variable continue comme par catégorie.
F() contient des arguments supplémentaires faible, élevé et exclure, qui peut être utilisé pour spécifier la valeur de la catégorie la plus basse, la catégorie la plus élevée et comment gérer des valeurs en dehors de la plage spécifiée.
Cet exemple, qui utilise l’exemple données de recensement livrées avec RevoScaleR, utilise simplement F() traite la variable 'âge' comme un facteur dans la formule de synthèse :
sampleDataDir <- rxGetOption("sampleDataDir") censusWorkers <- file.path(sampleDataDir, "CensusWorkers.xdf")
rxSummary(~ F(age) + sex, data = censusWorkers)
Pour plus d’informations sur la syntaxe de la formule RevoScaleR, tapez ? rxFormula à la console Enterprise R de révolution.