Controllo della qualità: Come casualmente selezionare dati da un file di .xdf?

È possibile utilizzare una funzione di 'trasformare' R per trasformare i dati e passare tale funzione alla funzione 'rxDataStepXdf()' RevoScaleR. È quindi possibile utilizzare file appena creato, .xdf sottoinsieme con altre funzioni RevoScaleR. Di seguito è riportato uno script di esempio R che crea un nuovo file di .xdf da un file di .xdf più grande utilizzando la variabile di selezione riga nascosta disponibile in 'transformFunc' di campionamento casuale.

# Create a transformFunc that selects 25% of the data at random set.seed(13) 
xform <- function(data) { 
data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) 
return(data) 

rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) 
# check that subsetting was done and the row selection variable is not kept in the data set. 
rxGetInfoXdf(inFile) 
rxGetInfoXdf("sampledData.xdf") 

Serve aiuto?

Amplia le tue competenze
Esplora i corsi di formazione
Ottieni in anticipo le nuove caratteristiche
Partecipa a Microsoft Insider

Queste informazioni sono risultate utili?

Grazie per il feedback!

Grazie per il tuo feedback! Potrebbe essere utile metterti in contatto con uno dei nostri operatori del supporto di Office.

×