Bu tür bir şey için çok faydalı RevoScaleR işlevi rxSummary() olur. Etkileşimi terimlerini içeren bir formül belirtirseniz, varsayılan olarak bu Grup anlamına gelir ve standart sapmalar aynı zamanda hücre sayımları ve geçerli gözlem sayısı bildirir. İçinde sevk edilen dataset 'CensusWorkers.xdf' kullandığımız örnekleri aşağıda.
Örnek: -------- testDataDir <-file.path(rxGetOption("sampleDataDir")) rxSummary (incwage ~ seks: durumu, veri = file.path (testDataDir, "CensusWorkers.xdf")) Geçerli gözlem sayısı: 351121 Eksik gözlem sayısı: 0 Adı ortalama STDSAPMA Min Max ValidObs incwage:sex:State 35333.84 40444.54 0 354000 351121 Kategori (6 kategori) göre İstatistikler: Kategori seks durumu anlamına gelir STDSAPMA incwage seks için erkek, durum = Connecticut erkek Connecticut 55002.00 = 67742.93 incwage seks için kadın, durum = Connecticut kadın Connecticut 32605.03 = 34426.27 incwage seks için erkek, durum = Indiana erkek Indiana 38325.33 = 36160.07 incwage seks için kadın, durum = Indiana kadın Indiana 23117.71 = 20371.68 incwage seks için erkek, durum = Washington erkek Washington 41001.14 = 43962.65 incwage seks için kadın, durum = Washington kadın Washington 25765.03 = 25191.75 Min Max ValidObs MissingObs 0 354000 41751 0 0 354000 37666 0 0 314000 74221 0 0 314000 63702 0 0 336000 73372 0 0 336000 60409 0 Verilerinizi belirli bazı değişkenlerin değerlerini temel alan başka alt 'rowSelection' bağımsız değişkeni kullanabilirsiniz. Başka bir yararlı işlevi RevoScaleR belirli bir değişkenin bir faktör ele almasını söyler 'F()' işlevi şu şekildedir: Örnek: -------- ### XDF dosyasında değişken türleri hakkında bilgi edinin rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE) rxSummary (incwage ~ F (yaş): seks, veri file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = = (durumu == "Indiana"))