Vous pouvez utiliser une fonction de « transformer » R pour transformer les données et de passer de cette fonction à la fonction de 'rxDataStepXdf()' RevoScaleR. Vous pouvez ensuite utiliser le fichier .xdf de sous-ensemble nouvellement créé, avec d’autres fonctions de RevoScaleR. Voici un exemple R de script qui crée un nouveau fichier .xdf par échantillonnage de façon aléatoire un fichier plus volumineux de .xdf à l’aide de la variable de sélection de ligne masquée disponible dans 'transformFunc'.
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")