Il rxSummary() funzione RevoScaleR rivela molto utile per questo tipo di operazione. Per impostazione predefinita segnalerà gruppo mezzi e deviazioni standard, nonché i conteggi di cella e il numero di osservazioni valide, se si specifica una formula che include i termini di interazione. Nel seguito esempi utilizziamo il dataset spedito 'CensusWorkers.xdf'.
Esempio:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ sesso: lo stato, dati = file.path (testDataDir, "CensusWorkers.xdf"))
Numero di osservazioni valide: 351121
Numero di osservazioni mancanti: 0
Nome Media StdDev Min Max ValidObs
incwage:Sex:state 35333.84 40444.54 0 354000 351121
Statistiche per categoria (6 categorie):
Stato sesso categoria StdDev mezzi
incwage di sesso maschile, stato = = Como maschio Como 55002.00 67742.93
incwage per sesso femmina, stato = = Como femmina Como 32605.03 34426.27
incwage di sesso maschile, stato = = Indiana maschio Indiana 38325.33 36160.07
incwage per sesso femmina, stato = = Indiana femmina Indiana 23117.71 20371.68
incwage per sesso maschile, stato = = Washington maschio Washington 41001.14 43962.65
incwage per sesso = femmina, stato di Washington femmina Washington 25765.03 = 25191.75
Min Max ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
È possibile utilizzare l'argomento 'rowSelection' al sottoinsieme ulteriormente i dati basati su valori specifici di alcune delle variabili. Un'altra funzione utile è la funzione 'F ()', che RevoScaleR di trattare una variabile specifica come fattore indica:
Esempio:
--------
# # # Ottenere informazioni sui tipi di variabili nel file XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (age): sesso, dati = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (stato = = "Indiana"))