Aquí están las reglas básicas y se aplican a las fórmulas de todas las funciones de análisis de RevoScaleR:
1. la interacción de dos variables continuas equivale a la multiplicación de las variables y, por tanto, es continua. Es decir, w:x es el mismo que w * x.
2. la interacción de dos factores (variables por categorías) es una variable categórica cuyas categorías son todas las combinaciones posibles de las categorías de las dos variables originales. Por lo tanto, edad: sexo, si ambos son categóricos, contiene todas las categorías de edad y sexo.
3. la interacción de una variable continua y resultados de una variable por categorías en una variable de "interacción" en la que está operando la variable continua dentro de cada categoría. Por lo tanto, rxSummary (~ ingresos: sexo) proporciona estadísticas de resumen para los ingresos dentro de cada categoría de sexo; rxCube (~ ingresos: sexo) calcula promedio de ingresos dentro de cada categoría de sexo. Para rxSummary (Esto es un cambio muy reciente) y rxCube/rxCrossTab, ~ ingresos: sexo equivale a ingresos ~ sexo. Es decir, se puede poner la variable continua en el lado izquierdo de la ~.
Estas reglas se aplican a varias variables continuas y por categoría. Todas las variables continuas se multiplican por el otro, todas las variables por categorías están interactuados para dar una variable categórica combinada y, a continuación, la variable continua resultante es operada en dentro de cada categoría de la variable de categorías resultante.