Aqui estão as regras básicas e se aplicam às fórmulas em todas as funções de análise em RevoScaleR:
1. a interação de duas variáveis contínuas é equivalente a multiplicação dessas variáveis e, portanto, é contínua. Ou seja, w:x é o mesmo que w * x.
2. a interação de dois fatores (variáveis categóricos) é uma variável categórica cujas categorias são todas as combinações possíveis das categorias de duas variáveis do originais. Assim, idade: sexo, se ambos estiverem categóricos, contém todas as categorias de idade e sexo.
3. a interação de uma variável contínua e uma categórica resultados variáveis em uma variável "interaction" em que a variável contínua é operada em dentro de cada categoria. Portanto, rxSummary (~ renda: sexo) fornece estatísticas resumidas para Lucros e perdas dentro de cada categoria de sexo; rxCube (~ renda: sexo) calcula a média de renda dentro de cada categoria de sexo. Para rxSummary (Isso é uma alteração muito recente) e rxCube/rxCrossTab ~ renda: sexo é equivalente ao rendimento ~ sexo. Isto é, a variável contínua pode ser colocada no lado esquerdo da ~.
Essas regras são aplicadas a várias variáveis contínuas e categóricos. Todas as variáveis contínuas são multiplicadas por si e todas as variáveis categóricos são interagir para dar uma variável categórica combinada e a variável contínua resultante é operada em cada categoria da variável categórica resultante.