Puede utilizar una función de 'transform' R para transformar los datos y pasar esa función a la función 'rxDataStepXdf()' RevoScaleR. A continuación, puede utilizar el archivo .xdf de subconjunto recién creado con otras funciones de RevoScaleR. A continuación es una secuencia de comandos de ejemplo R que crea un nuevo archivo .xdf mediante el muestreo al azar de un archivo mayor de .xdf utilizar la variable de selección de fila oculta disponible en 'transformFunc'.
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")