Pode utilizar uma função de 'transform' R para transformar os dados e passar essa função para a função de 'rxDataStepXdf()' RevoScaleR. Em seguida, pode utilizar o ficheiro de .xdf de subconjunto recentemente criado, com outras funções de RevoScaleR. Segue-se um script de exemplo R que cria um novo ficheiro de .xdf por amostragem aleatoriamente um ficheiro de .xdf maior utilizando a variável de selecção de linha oculta disponível na 'transformFunc'.
# Create a transformFunc that selects 25% of the data at random set.seed(13) xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")