Функції-rxSummary() RevoScaleR зручно дуже для такого роду речі. За промовчанням він повідомляє про Група і стандартні відхилення, а також клітинки вважається і кількість дійсний зауваження, якщо вказати формулу, яка містить взаємодії умови. У полі нижче прикладах, ми використовуємо випущена набору даних "CensusWorkers.xdf".
Наприклад:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ статі: стані, дані = file.path (testDataDir "CensusWorkers.xdf"))
Кількість дійсний зауваження: 351121
Кількість відсутніх зауваження: 0
Ім'я означає, що стандартне відхилення Min, Max ValidObs
incwage:Sex:State 35333.84 40444.54 351121 0-354000
Статистика за категоріями (6 категорій):
Категорія статі стану, засоби, стандартне відхилення
incwage, для статі = чоловік, стан = Коннектикут, чоловік Коннектикут 55002.00 67742.93
incwage, для статі = жінки, стан = Коннектикут жін Коннектикут-32605.03 34426.27
incwage, для статі = чоловік, стан = Індіана Індіана, чоловік 38325.33 36160.07
incwage, для статі = жінки, стан = Індіана жін-Індіана 23117.71 20371.68
incwage, для статі = чоловік, стан = Вашингтон Вашингтон, чоловік 41001.14 43962.65
incwage, для статі = жінки, стан = Вашингтон Вашингтон, жін 25765.03 25191.75
Min-Max ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
'RowSelection' аргумент для подальших, набір даних на основі певними значеннями деякі змінні, можна використовувати. Інша корисна функція – це "F()" функції повідомляє RevoScaleR певних змінну вважати фактор:
Наприклад:
--------
# # # Отримати інформацію про типів змінних, у XDF.
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (років): статі, дані = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (стан =-= "Індіана"))