RevoScaleR chức năng rxSummary() có rất thuận tiện cho loại điều này. Theo mặc định nó sẽ báo cáo có nghĩa là nhóm và độ lệch chuẩn cũng như tính di động và số quan sát hợp lệ, nếu bạn chỉ định một công thức có điều kiện tương tác. Trong phần dưới đây mô hình chúng tôi sử dụng dữ liệu chuyển 'CensusWorkers.xdf'.Ví dụ:-------- testDataDir <-file.path(rxGetOption("sampleDataDir"))rxSummary (incwage ~ tình: trạng thái, dữ liệu = file.path (testDataDir, "CensusWorkers.xdf"))Số hiệu lực quan sát: 351121Số thiếu quan sát: 0Tên có nghĩa là StdDev phút tối đa ValidObsincwage:Sex:State 35333.84 40444.54 0 354000 351121Số liệu thống kê theo loại (6 loại):Loại tình trạng thái có nghĩa là StdDevincwage cho sex = Nam, trạng thái = Connecticut Nam Connecticut 55002.00 67742.93incwage cho sex = Nam, trạng thái = Connecticut tỷ Connecticut 32605.03 34426.27incwage cho sex = Nam, trạng thái = Indiana Nam Indiana 38325.33 36160.07incwage cho sex = Nam, trạng thái = Indiana tỷ Indiana 23117.71 20371.68incwage cho sex = Nam, trạng thái = Washington Nam Washington 41001.14 43962.65incwage cho sex = Nam, trạng thái = Washington tỷ Washington 25765.03 25191.75Phút tối đa ValidObs MissingObs0 354000 41751 00 354000 37666 00 314000 74221 00 314000 63702 00 336000 73372 00 336000 60409 0Bạn có thể sử dụng tham số 'rowSelection' để thêm tập dữ liệu dựa trên các giá trị cụ thể của một số các yếu tố. Chức năng hữu ích khác là hàm 'F()' cho RevoScaleR coi một biến cụ thể là một yếu tố:Ví dụ:-------- ### Nhận thông tin về thay đổi loại tệp XDFrxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)rxSummary (incwage ~ F (tuổi): sex, dữ liệu = file.path(testDataDir,"CensusWorkers.xdf") rowSelection = (trạng thái == "Indiana"))
Làm thế nào để: Làm thế nào có thể tính toán số liệu thống kê nhóm theo thể loại dữ liệu lớn.
Áp dụng cho
Revolution Analytics