RevoScaleR funkcija rxSummary() labai praverčia šių dalykų. Pagal numatytuosius parametrus pateikia grupės priemonėmis ir standartinis nuokrypis taip pat langelių skaičius ir skaičius svarbių pastabų, jei nurodysite formulę, kurioje yra sąveikos. Kad žemiau naudojame išsiųstų duomenų rinkinio "CensusWorkers.xdf".
Pavyzdys:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ sekso: būseną, duomenų = file.path (testDataDir, "CensusWorkers.xdf"))
Svarbių pastabų skaičius: 351121
Nėra pastabų skaičius: 0
Pavadinimas reiškia StdDev Min Max ValidObs
incwage:sex:State 35333.84 40444.54 0 354000 351121
Statistika pagal kategorijas (6 kategorijos):
Kategorijos sekso būsena reiškia StdDev
incwage sekso = vyras, būsena = Connecticut vyras Connecticut 55002.00 67742.93
incwage sekso = moteris, būsena = Connecticut Female Connecticut 32605.03 34426.27
incwage sekso = vyras, būsena = Indiana vyras Indiana 38325.33 36160.07
incwage sekso = moteris, būsena = Indiana Female Indiana 23117.71 20371.68
incwage sekso = vyras, būsena = Washington vyras Washington 41001.14 43962.65
incwage sekso = moteris, būsena = Washington Female Washington 25765.03 25191.75
Min Max ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
Galite naudoti "rowSelection" argumentas dar pogrupiui duomenis pagal tam tikras reikšmes, kai kintamieji. Dar viena naudinga funkcija yra "F()" funkciją, kuri nurodoma, RevoScaleR konkrečią kintamasis laikyti veiksnys:
Pavyzdys:
--------
### Gauti informacijos apie kintamųjų tipai XDF faile
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (metai): sekso, duomenų = file.path(testDataDir,"CensusWorkers.xdf") rowSelection = (būsena == "Indiana"))