Assurance qualité : Comment puis-je aléatoirement sélectionner données à partir d’un fichier .xdf ?

Assistance

Se connecter

Se connecter avec Microsoft

S'identifier ou créer un compte.

Bonjour,

Sélectionnez un autre compte.

Vous avez plusieurs comptes

Choisissez le compte avec lequel vous voulez vous connecter.

S’applique à

Revolution Analytics

Vous pouvez utiliser une fonction de « transformer » R pour transformer les données et de passer de cette fonction à la fonction de 'rxDataStepXdf()' RevoScaleR. Vous pouvez ensuite utiliser le fichier .xdf de sous-ensemble nouvellement créé, avec d’autres fonctions de RevoScaleR. Voici un exemple R de script qui crée un nouveau fichier .xdf par échantillonnage de façon aléatoire un fichier plus volumineux de .xdf à l’aide de la variable de sélection de ligne masquée disponible dans 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) 
xform <- function(data) { 
data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) 
return(data) 
} 
rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) 
# check that subsetting was done and the row selection variable is not kept in the data set. 
rxGetInfoXdf(inFile) 
rxGetInfoXdf("sampledData.xdf")