RevoScaleR chức năng rxSummary() có rất thuận tiện cho loại điều này. Theo mặc định nó sẽ báo cáo có nghĩa là nhóm và độ lệch chuẩn cũng như tính di động và số quan sát hợp lệ, nếu bạn chỉ định một công thức có điều kiện tương tác. Trong phần dưới đây mô hình chúng tôi sử dụng dữ liệu chuyển 'CensusWorkers.xdf'.
Ví dụ:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ tình: trạng thái, dữ liệu = file.path (testDataDir, "CensusWorkers.xdf"))
Số hiệu lực quan sát: 351121
Số thiếu quan sát: 0
Tên có nghĩa là StdDev phút tối đa ValidObs
incwage:Sex:State 35333.84 40444.54 0 354000 351121
Số liệu thống kê theo loại (6 loại):
Loại tình trạng thái có nghĩa là StdDev
incwage cho sex = Nam, trạng thái = Connecticut Nam Connecticut 55002.00 67742.93
incwage cho sex = Nam, trạng thái = Connecticut tỷ Connecticut 32605.03 34426.27
incwage cho sex = Nam, trạng thái = Indiana Nam Indiana 38325.33 36160.07
incwage cho sex = Nam, trạng thái = Indiana tỷ Indiana 23117.71 20371.68
incwage cho sex = Nam, trạng thái = Washington Nam Washington 41001.14 43962.65
incwage cho sex = Nam, trạng thái = Washington tỷ Washington 25765.03 25191.75
Phút tối đa ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
Bạn có thể sử dụng tham số 'rowSelection' để thêm tập dữ liệu dựa trên các giá trị cụ thể của một số các yếu tố. Chức năng hữu ích khác là hàm 'F()' cho RevoScaleR coi một biến cụ thể là một yếu tố:
Ví dụ:
--------
### Nhận thông tin về thay đổi loại tệp XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (tuổi): sex, dữ liệu = file.path(testDataDir,"CensusWorkers.xdf") rowSelection = (trạng thái == "Indiana"))