Την rxSummary() συνάρτηση RevoScaleR αποδεικνύεται πολύ χρήσιμη για αυτό το είδος πράγμα. Από προεπιλογή θα παρουσιαστεί ομάδα σημαίνει ότι και τυπικές αποκλίσεις καθώς και μετρήσεις κελί και τον αριθμό των έγκυρων παρατηρήσεις, εάν καθορίσετε έναν τύπο που περιλαμβάνει τους όρους επικοινωνίας. Με τα παρακάτω παραδείγματα χρησιμοποιούμε το dataset αποστολής 'CensusWorkers.xdf'.
Παράδειγμα:
--------
testDataDir <-file.path(rxGetOption("sampleDataDir"))
rxSummary (incwage ~ δεδομένων, φύλου: κατάσταση = file.path (testDataDir, "CensusWorkers.xdf"))
Αριθμός των έγκυρων παρατηρήσεων: 351121
Αριθμό λείπουν παρατηρήσεων: 0
Μέση τυπική απόκλιση ValidObs Max Min όνομα
incwage:sex:state 35333.84 40444.54 0 354000 351121
Στατιστικά στοιχεία ανά κατηγορία (6 κατηγορίες):
Κατηγορία φύλο κατάσταση μέσα τυπική απόκλιση
incwage για φύλο = αρσενικό, κατάσταση = αρσενικά Connecticut Connecticut 55002.00 67742.93
incwage για φύλο = Γυναίκα, κατάσταση = θηλυκά Connecticut Connecticut 32605.03 34426.27
incwage για φύλο = αρσενικό, κατάσταση = Ιντιάνα αρσενικά Ιντιάνα 38325.33 36160.07
incwage για φύλο = Γυναίκα, κατάσταση = Ιντιάνα θηλυκά Ιντιάνα 23117.71 20371.68
incwage για φύλο = αρσενικό, κατάσταση = Ουάσιγκτον αρσενικά Ουάσιγκτον 41001.14 43962.65
incwage για φύλο = Γυναίκα, κατάσταση = Ουάσιγκτον θηλυκά Ουάσιγκτον 25765.03 25191.75
Min Max ValidObs MissingObs
0 354000 41751 0
0 354000 37666 0
0 314000 74221 0
0 314000 63702 0
0 336000 73372 0
0 336000 60409 0
Μπορείτε να χρησιμοποιήσετε το όρισμα 'rowSelection' σε υποσύνολο περαιτέρω τα δεδομένα σας με βάση συγκεκριμένες τιμές από ορισμένες από τις μεταβλητές. Μια άλλη χρήσιμη λειτουργία είναι τη συνάρτηση 'F()', που σας ενημερώνει ότι RevoScaleR να χειριστείτε μια συγκεκριμένη μεταβλητή ως παράγοντα:
Παράδειγμα:
--------
### Λήψη πληροφοριών σχετικά με τους τύπους μεταβλητών στο αρχείο XDF
rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)
rxSummary (incwage ~ F (ηλικία): σεξ, δεδομένα = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (κατάσταση == "Ιντιάνα"))