Как да: Как да изчисли група статистика по категории за голям набор от данни.

Функция rxSummary() RevoScaleR идва в много удобен за този вид. По подразбиране ще отчете група и стандартно отклонение, както и клетки и броя на валидни наблюдения, ако посочите формула, която включва взаимодействие с условия. В по-долу примери използваме експедирани данни "CensusWorkers.xdf".Пример:-------- testDataDir <-file.path(rxGetOption("sampleDataDir"))rxSummary (incwage ~ Пол: състояние, данни = file.path (testDataDir, "CensusWorkers.xdf"))Брой валидни наблюдения: 351121Брой на липсващите бележки: 0Името означава отклонение мин Max ValidObsincwage:Sex:State 35333.84 40444.54 0 354000 351121Статистика по категории (6 категории):Категория Пол състояние означава отклонениеincwage за Пол = мъж състояние = мъжки Кънектикът Кънектикът 55002.00 67742.93incwage за Пол = жена състояние = женски Кънектикът Кънектикът 32605.03 34426.27incwage за Пол = мъж състояние = мъжки Индиана Индиана 38325.33 36160.07incwage за Пол = жена състояние = женски Индиана Индиана 23117.71 20371.68incwage за Пол = мъж състояние = Вашингтон мъжки Вашингтон 41001.14 43962.65incwage за Пол = жена състояние = Вашингтон женски Вашингтон 25765.03 25191.75Мин Max ValidObs MissingObs0 354000 41751 00 354000 37666 00 314000 74221 00 314000 63702 00 336000 73372 00 336000 60409 0Можете да използвате аргумента "rowSelection" за допълнителни подмножество на данните въз основа на определени стойности на някои променливи. Друга полезна функция е "F()" функция, която казва RevoScaleR да третира определени променлива като фактор:Пример:-------- ### Получи информация за различни видове в XDF файлrxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)rxSummary (incwage ~ F (възраст): Пол, данни = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (състояние == "Индиана"))

Как да: Как да изчисли група статистика по категории за голям набор от данни.

Нуждаете ли се от още помощ?

Искате ли още опции?

Беше ли полезна тази информация?

Благодарим ви за обратната връзка!