QA: Hur kan jag slumpmässigt välja data från en .xdf-fil?

En R "omvandla" funktionen använder du för att omvandla data och skicka funktionen till funktionen 'rxDataStepXdf()' RevoScaleR. Du kan sedan använda den nyligen skapade delmängd .xdf filen med andra RevoScaleR funktioner. Nedan ser du ett exempelskript R som skapar en ny .xdf-fil genom att slumpvis provtagning en större .xdf-fil med dold rad val variabel i 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) 
xform <- function(data) { 
data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) 
return(data) 

rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) 
# check that subsetting was done and the row selection variable is not kept in the data set. 
rxGetInfoXdf(inFile) 
rxGetInfoXdf("sampledData.xdf") 

Behöver du mer hjälp?

Utöka dina kunskaper
Utforska utbildning
Få nya funktioner först
Anslut till Microsoft Insiders

Hade du nytta av den här informationen?

Tack för din feedback!

Tack för din feedback! Det låter som att det kan vara bra att koppla dig till en av våra Office-supportrepresentanter.

×