È possibile utilizzare una funzione di 'trasformare' R per trasformare i dati e passare tale funzione alla funzione 'rxDataStepXdf()' RevoScaleR. È quindi possibile utilizzare file appena creato, .xdf sottoinsieme con altre funzioni RevoScaleR. Di seguito è riportato uno script di esempio R che crea un nuovo file di .xdf da un file di .xdf più grande utilizzando la variabile di selezione riga nascosta disponibile in 'transformFunc' di campionamento casuale.
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")