Aplica-se a
Revolution Analytics

Você pode usar uma função de R 'Transformar' para transformar os dados e passar essa função para a função de 'rxDataStepXdf()' RevoScaleR. Em seguida, você pode usar o arquivo de .xdf de subconjunto recém-criado, com outras funções de RevoScaleR. Abaixo está um script de exemplo R que cria um novo arquivo de .xdf por amostragem aleatoriamente um arquivo .xdf maior usando a variável de seleção de linha oculta disponível no 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf") 

Precisa de mais ajuda?

Quer mais opções

Explore os benefícios da assinatura, procure cursos de treinamento, saiba como proteger seu dispositivo e muito mais.