RxSummary() funkcji RevoScaleR jest bardzo przydatna dla tego rodzaju rzeczy. Domyślnie zgłosi grupa środki i standardowymi odchyleniami, a także liczby komórek oraz liczba obserwacji prawidłowe, jeśli określisz formułę zawierającą terminami dotyczącymi interakcji. W poniżej przykłady używamy wysłany zestaw danych "CensusWorkers.xdf".
Przykład:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ sex: Państwo, danych = file.path (testDataDir, "CensusWorkers.xdf"))
Liczba obserwacji prawidłowe: 351121
Liczba brakujących danych: 0
Nazwa średniej OdchStd Min Maks ValidObs
incwage:Sex:State 35333.84 40444.54 0 354000 351121
Statystyka wg kategorii (6 kategorii):
Kategoria płci state OdchStd środków
incwage do seksu = Mężczyzna, stan = płci męskiej Connecticut Connecticut 55002.00 67742.93
incwage do seksu = kobieta, stan = płci żeńskiej Connecticut Connecticut 32605.03 34426.27
incwage do seksu = Mężczyzna, stan Indiana płci męskiej Indiana 38325.33 = 36160.07
incwage do seksu = kobieta, stan Indiana płci żeńskiej Indiana 23117.71 = 20371.68
incwage do seksu = Mężczyzna, stan Waszyngton Washington płci męskiej 41001.14 = 43962.65
incwage do seksu = kobieta, stan Waszyngton Washington płci żeńskiej 25765.03 = 25191.75
Min maks ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
Można użyć argumentu 'rowSelection' do dalszych podzbiór danych na podstawie określonych wartości niektóre zmienne. Kolejną użyteczną funkcją jest funkcja "F()", która mówi RevoScaleR w leczeniu określoną zmienną jako czynnik:
Przykład:
--------
### Uzyskać informacje na temat typów zmiennych w pliku XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (wiek): płeć danych = file.path(testDataDir,"CensusWorkers.xdf") rowSelection = (stanu == "Indiana"))