Il rxSummary() funzione RevoScaleR rivela molto utile per questo tipo di operazione. Per impostazione predefinita segnalerà gruppo mezzi e deviazioni standard, nonché i conteggi di cella e il numero di osservazioni valide, se si specifica una formula che include i termini di interazione. Nel seguito esempi utilizziamo il dataset spedito 'CensusWorkers.xdf'.
Esempio: -------- testDataDir <-file.path(rxGetOption("sampleDataDir")) rxSummary (incwage ~ sesso: lo stato, dati = file.path (testDataDir, "CensusWorkers.xdf")) Numero di osservazioni valide: 351121 Numero di osservazioni mancanti: 0 Nome Media StdDev Min Max ValidObs incwage:Sex:state 35333.84 40444.54 0 354000 351121 Statistiche per categoria (6 categorie): Stato sesso categoria StdDev mezzi incwage di sesso maschile, stato = = Como maschio Como 55002.00 67742.93 incwage per sesso femmina, stato = = Como femmina Como 32605.03 34426.27 incwage di sesso maschile, stato = = Indiana maschio Indiana 38325.33 36160.07 incwage per sesso femmina, stato = = Indiana femmina Indiana 23117.71 20371.68 incwage per sesso maschile, stato = = Washington maschio Washington 41001.14 43962.65 incwage per sesso = femmina, stato di Washington femmina Washington 25765.03 = 25191.75 Min Max ValidObs MissingObs 0 354000 41751 0 0 354000 37666 0 0 314000 74221 0 0 314000 63702 0 0 336000 73372 0 0 336000 60409 0 È possibile utilizzare l'argomento 'rowSelection' al sottoinsieme ulteriormente i dati basati su valori specifici di alcune delle variabili. Un'altra funzione utile è la funzione 'F ()', che RevoScaleR di trattare una variabile specifica come fattore indica: Esempio: -------- # # # Ottenere informazioni sui tipi di variabili nel file XDF rxGetInfo(file.path(testDataDir,"CensusWorkers.xdf"), getVarInfo = TRUE) rxSummary (incwage ~ F (age): sesso, dati = file.path(testDataDir,"CensusWorkers.xdf"), rowSelection = (stato = = "Indiana"))Procedura: Come posso calcolerò statistiche gruppo in base alla categoria per un dataset di grandi dimensioni.
Si applica a
Revolution Analytics