Du kan bruke en transformering' R-funksjonen til å transformere dataene og sende denne funksjonen til RevoScaleR 'rxDataStepXdf()'-funksjonen. Du kan deretter bruke den nylig opprettede delsett .xdf filen med andre RevoScaleR funksjoner. Nedenfor er et eksempel R-skript som oppretter en ny .xdf-fil med tilfeldig utvalg av en større .xdf-fil ved hjelp av skjulte raden utvalg variabelen tilgjengelig i 'transformFunc'.
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) {
data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25))
return(data)
}
rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE)
# check that subsetting was done and the row selection variable is not kept in the data set.
rxGetInfoXdf(inFile)
rxGetInfoXdf("sampledData.xdf")