Puede utilizar una función de 'transform' R para transformar los datos y pasar esa función a la función 'rxDataStepXdf()' RevoScaleR. A continuación, puede utilizar el archivo .xdf de subconjunto recién creado con otras funciones de RevoScaleR. A continuación es una secuencia de comandos de ejemplo R que crea un nuevo archivo .xdf mediante el muestreo al azar de un archivo mayor de .xdf utilizar la variable de selección de fila oculta disponible en 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf") 

¿Necesita más ayuda?

¿Quiere más opciones?

Explore las ventajas de las suscripciones, examine los cursos de aprendizaje, aprenda a proteger su dispositivo y mucho más.

Las comunidades le ayudan a formular y responder preguntas, enviar comentarios y leer a expertos con conocimientos extensos.