Utilizați funcția 'transform' R pentru a transforma datele şi să treacă această funcție pentru funcția RevoScaleR 'rxDataStepXdf()'. Apoi utilizați fișierul nou creat, subset .xdf cu alte funcții RevoScaleR. Mai jos este un exemplu R script care creează un nou fișier .xdf prin sondaj aleator o mai mare .xdf fișierul utilizând variabila de selecție ascunse rând disponibile în 'transformFunc'.
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")