RevoScaleR funkcia rxSummary() hodí veľmi na takéto veci. V predvolenom nastavení bude správa skupiny prostriedkov a štandardná odchýlka, ako aj buniek a číslo platné vyjadrenie, ak zadáte vzorec, ktorý zahŕňa interakcie. V nižšie uvedených príkladoch používame odoslané dataset "CensusWorkers.xdf".
Príklad:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ pohlavie: stav, údaje = file.path (testDataDir, "CensusWorkers.xdf"))
Číslo platné pripomienky: 351121
Počet chýbajúcich pripomienky: 0
Názov znamená smerodajnej Min Max ValidObs
incwage:Sex:State 35333.84 40444.54 0 354000 351121
Štatistika podľa kategórie (6 kategórie):
Kategória sex stav znamená smerodajnej
incwage sex = Male, stav = Connecticut muž Connecticut 55002.00 67742.93
incwage sex = Slovensko stav = Connecticut žena Connecticut 32605.03 34426.27
incwage sex = Male, stav = Indiana muž Indiana 38325.33 36160.07
incwage sex = Slovensko stav = Indiana žena Indiana 23117.71 20371.68
incwage sex = Male, stav = Washington muž Washington 41001.14 43962.65
incwage sex = Slovensko stav = žena Washington Washington 25765.03 25191.75
Min Max ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
Môžete použiť "rowSelection" argument ďalšie podmnožiny údajov na základe konkrétnych hodnoty niektorých premenných. Ďalšie užitočné funkcie je "F()" funkcia, ktorá oznamuje RevoScaleR považovať za faktor špecifického ukazovateľa:
Príklad:
--------
### Získať informácie o premennej typy XDF súboru
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (rokov): pohlavie, údaje = file.path(testDataDir,"CensusWorkers.xdf") rowSelection = (stav == "Indiana"))