Την rxSummary() συνάρτηση RevoScaleR αποδεικνύεται πολύ χρήσιμη για αυτό το είδος πράγμα. Από προεπιλογή θα παρουσιαστεί ομάδα σημαίνει ότι και τυπικές αποκλίσεις καθώς και μετρήσεις κελί και τον αριθμό των έγκυρων παρατηρήσεις, εάν καθορίσετε έναν τύπο που περιλαμβάνει τους όρους επικοινωνίας. Με τα παρακάτω παραδείγματα χρησιμοποιούμε το dataset αποστολής 'CensusWorkers.xdf'.Παράδειγμα:-------- testDataDir <-file.path(rxGetOption("sampleDataDir"))rxSummary (incwage ~ δεδομένων, φύλου: κατάσταση = file.path (testDataDir, "CensusWorkers.xdf"))Αριθμός των έγκυρων παρατηρήσεων: 351121Αριθμό λείπουν παρατηρήσεων: 0Μέση τυπική απόκλιση ValidObs Max Min όνομαincwage:sex:state 35333.84 40444.54 0 354000 351121Στατιστικά στοιχεία ανά κατηγορία (6 κατηγορίες):Κατηγορία φύλο κατάσταση μέσα τυπική απόκλισηincwage για φύλο = αρσενικό, κατάσταση = αρσενικά Connecticut Connecticut 55002.00 67742.93incwage για φύλο = Γυναίκα, κατάσταση = θηλυκά Connecticut Connecticut 32605.03 34426.27incwage για φύλο = αρσενικό, κατάσταση = Ιντιάνα αρσενικά Ιντιάνα 38325.33 36160.07incwage για φύλο = Γυναίκα, κατάσταση = Ιντιάνα θηλυκά Ιντιάνα 23117.71 20371.68incwage για φύλο = αρσενικό, κατάσταση = Ουάσιγκτον αρσενικά Ουάσιγκτον 41001.14 43962.65incwage για φύλο = Γυναίκα, κατάσταση = Ουάσιγκτον θηλυκά Ουάσιγκτον 25765.03 25191.75Min Max ValidObs MissingObs0 354000 41751 00 354000 37666 00 314000 74221 00 314000 63702 00 336000 73372 00 336000 60409 0Μπορείτε να χρησιμοποιήσετε το όρισμα 'rowSelection' σε υποσύνολο περαιτέρω τα δεδομένα σας με βάση συγκεκριμένες τιμές από ορισμένες από τις μεταβλητές. Μια άλλη χρήσιμη λειτουργία είναι τη συνάρτηση 'F()', που σας ενημερώνει ότι RevoScaleR να χειριστείτε μια συγκεκριμένη μεταβλητή ως παράγοντα:Παράδειγμα:-------- ### Λήψη πληροφοριών σχετικά με τους τύπους μεταβλητών στο αρχείο XDFrxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE)rxSummary (incwage ~ F (ηλικία): σεξ, δεδομένα = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (κατάσταση == "Ιντιάνα"))
ΔΙΑΔΙΚΑΣΙΕΣ: Πώς να θα υπολογίσετε στατιστικά ομάδας ανά κατηγορία για ένα μεγάλο σύνολο δεδομένων.
Ισχύει για
Revolution Analytics