Aplica-se A
Revolution Analytics

Pode utilizar uma função de 'transform' R para transformar os dados e passar essa função para a função de 'rxDataStepXdf()' RevoScaleR. Em seguida, pode utilizar o ficheiro de .xdf de subconjunto recentemente criado, com outras funções de RevoScaleR. Segue-se um script de exemplo R que cria um novo ficheiro de .xdf por amostragem aleatoriamente um ficheiro de .xdf maior utilizando a variável de selecção de linha oculta disponível na 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf") 

Precisa de mais ajuda?

Quer mais opções?

Explore os benefícios da subscrição, navegue em cursos de formação, saiba como proteger o seu dispositivo e muito mais.