Voici les règles de base et s’appliquent aux formules dans toutes les fonctions d’analyse de RevoScaleR :
1. l’interaction de deux variables continues est équivalente à la multiplication de ces variables et est donc continue. W:x est le même que w * x.
2. l’interaction de deux facteurs (variables par catégorie) est une variable catégorique dont les catégories sont toutes les combinaisons possibles des catégories de deux variables d’origine. Par conséquent, âge : sexe, si les deux sont catégoriques, contient toutes les catégories d’âge et sexe.
3. l’interaction entre une variable en continu et une variable catégorique entraîne une variable « interaction » dans lequel la variable continue est exploitée au sein de chaque catégorie. Ainsi, rxSummary (~ revenu : sexe) donne des statistiques récapitulatives de revenu au sein de chaque catégorie de sexe ; rxCube (~ revenu : sexe) calcule moyenne revenu au sein de chaque catégorie de sexe. RxSummary (il s’agit d’une modification très récente) et rxCube/rxCrossTab, ~ revenu : sexe est équivalent au revenu ~ sexe. Autrement dit, la variable continue peut être placée sur le côté gauche de la ~.
Ces règles s’appliquent à plusieurs variables continus et par catégorie. Toutes les variables en continu sont multipliés par d’autres, et toutes les variables par catégorie sont interagis pour donner à une variable catégorique combinée puis la variable continue qui en résulte est exploitée au sein de chaque catégorie de la variable catégorique résultante.