RevoScaleR-Funktion rxSummary() ist sehr nützlich für so etwas. Standardmäßig meldet es Gruppe bedeutet und Standardabweichungen und Zellen sowie Anzahl der gültigen Messwerte, wenn Sie eine Formel angeben, die Benutzerinteraktion enthält. In den folgenden Beispielen verwenden wir gelieferte Dataset 'CensusWorkers.xdf'.
Beispiel: -------- TestDataDir <-file.path(rxGetOption("sampleDataDir")) RxSummary (Incwage ~ Geschlecht: Zustand, Daten = file.path (TestDataDir, "CensusWorkers.xdf")) Anzahl der gültigen Messwerte: 351121 Anzahl der fehlenden Messwerte: 0 Name bedeutet StdDev Min Max ValidObs Incwage:Sex:State 35333.84 40444.54 0 354000 351121 Statistik nach Kategorie (6 Kategorien): Kategorie des Geschlechts Status bedeutet StdDev Incwage für Geschlecht = Männlich, Status = Männlich Connecticut Connecticut 55002.00 67742.93 Incwage für Geschlecht weiblich, Status = Weiblich Connecticut Connecticut 32605.03 = 34426.27 Incwage für Geschlecht = Männlich, Status = Männlich Indiana Indiana 38325.33 36160.07 Incwage für Geschlecht weiblich, Status = Weiblich Indiana Indiana 23117.71 = 20371.68 Incwage für Geschlecht = Männlich, Staat Washington männliche Washington 41001.14 = 43962.65 Incwage Sex = Weiblich Staat Washington weibliche Washington 25765.03 = 25191.75 Min Max ValidObs MissingObs 0 354000 41751 0 0 354000 37666 0 0 314000 74221 0 0 314000 63702 0 0 336000 73372 0 0 336000 60409 0 Dem Argument 'RowSelection' für weitere Teilmenge können die Daten basierend auf bestimmten Werten für einige der Variablen. Eine weitere nützliche Funktion ist die F()"-Funktion, die RevoScaleR eine bestimmte Variablen als Faktor behandelt wird: Beispiel: -------- ### Erfahren Sie Variablentypen XDF Datei rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), GetVarInfo = TRUE) RxSummary (Incwage ~ F (Alter): sex Daten = file.path(testDataDir,"CensusWorkers.xdf") RowSelection = (Status == "Indiana"))