Функції-rxSummary() RevoScaleR зручно дуже для такого роду речі. За промовчанням він повідомляє про Група і стандартні відхилення, а також клітинки вважається і кількість дійсний зауваження, якщо вказати формулу, яка містить взаємодії умови. У полі нижче прикладах, ми використовуємо випущена набору даних "CensusWorkers.xdf".Наприклад:-------- testDataDir <-file.path(rxGetOption("sampleDataDir"))rxSummary (incwage ~ статі: стані, дані = file.path (testDataDir "CensusWorkers.xdf"))Кількість дійсний зауваження: 351121Кількість відсутніх зауваження: 0Ім'я означає, що стандартне відхилення Min, Max ValidObsincwage:Sex:State 35333.84 40444.54 351121 0-354000Статистика за категоріями (6 категорій):Категорія статі стану, засоби, стандартне відхиленняincwage, для статі = чоловік, стан = Коннектикут, чоловік Коннектикут 55002.00 67742.93incwage, для статі = жінки, стан = Коннектикут жін Коннектикут-32605.03 34426.27incwage, для статі = чоловік, стан = Індіана Індіана, чоловік 38325.33 36160.07incwage, для статі = жінки, стан = Індіана жін-Індіана 23117.71 20371.68incwage, для статі = чоловік, стан = Вашингтон Вашингтон, чоловік 41001.14 43962.65incwage, для статі = жінки, стан = Вашингтон Вашингтон, жін 25765.03 25191.75Min-Max ValidObs MissingObs0 354000 41751 00 354000 37666 00 314000 74221 00 314000 63702 00 336000 73372 00 336000 60409 0'RowSelection' аргумент для подальших, набір даних на основі певними значеннями деякі змінні, можна використовувати. Інша корисна функція – це "F()" функції повідомляє RevoScaleR певних змінну вважати фактор:Наприклад:-------- # # # Отримати інформацію про типів змінних, у XDF.rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)rxSummary (incwage ~ F (років): статі, дані = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (стан =-= "Індіана"))
Виправлення: Як я може обчислення групи статистики за категоріями для великих наборів даних.
Застосовується до
Revolution Analytics