RevoScaleR 関数の rxSummary() は、この種のことを非常に便利です。既定で報告されますグループの平均と標準偏差と同様にセルの数の有効な値は、操作の用語を含む数式を指定する場合。'CensusWorkers.xdf' のリリース済みのデータセットを使用する例を以下します。
例: -------- testDataDir <-file.path(rxGetOption("sampleDataDir")) rxSummary (incwage ~ セックス: 状態、データ = file.path (testDataDir、"CensusWorkers.xdf")) 有効な観測値の数: 351121 欠測値の数: 0 名平均偏差最小最大 ValidObs incwage:sex:state 35333.84 40444.54 0 354000 351121 カテゴリ (6 カテゴリ) 別の統計情報: セックス状態のカテゴリは偏差 セックスの incwage (オス)、状態を = = コネチカット (オス) コネチカット 55002.00 67742.93 セックスの incwage (メス)、状態を = = コネチカット (メス) コネチカット 32605.03 34426.27 セックスの incwage (オス)、状態を = = インディアナ (オス) インディアナ 38325.33 36160.07 セックスの incwage (メス)、状態を = = インディアナ (メス) インディアナ 23117.71 20371.68 セックスの incwage (オス)、状態を = = ワシントン (オス) ワシントン 41001.14 43962.65 セックスの incwage (メス)、状態を = = ワシントン (メス) ワシントン 25765.03 25191.75 最小最大 ValidObs MissingObs 0 354000 41751 0 0 354000 37666 0 0 314000 74221 0 0 314000 63702 0 0 336000 73372 0 0 336000 60409 0 特定の一部の変数の値を基にデータ サブセットをさらに 'rowSelection' の引数を使用できます。他の有用な関数は、'F()' 関数を係数として、特定の変数を扱うには RevoScaleR です。 例: -------- ### および XDF ファイル内の変数の型に関する情報を取得します。 rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf")、getVarInfo = TRUE) rxSummary (incwage ~ F (歳): セックス、データ = file.path(testDataDir,"CensusWorkers.xdf")、rowSelection = (状態 =「インディアナ」))方法: 方法ことができます計算グループの統計情報によって大規模なデータセットのカテゴリ。
Applies To
Revolution Analyticsヘルプを表示
その他のオプションが必要ですか?
サブスクリプションの特典の参照、トレーニング コースの閲覧、デバイスのセキュリティ保護方法などについて説明します。
コミュニティは、質問をしたり質問の答えを得たり、フィードバックを提供したり、豊富な知識を持つ専門家の意見を聞いたりするのに役立ちます。