Функцию «преобразование» R можно использовать для преобразования данных и передачи этой функции в функцию «rxDataStepXdf()» RevoScaleR. Затем вновь созданного файла .xdf подмножества можно использовать с другими функциями RevoScaleR. Ниже приведен пример R сценария, который создает новый файл .xdf, случайным образом выборки большой файл .xdf с помощью выделения скрытых строк переменной в «transformFunc».

# Create a transformFunc that selects 25% of the data at random set.seed(13) xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf") 

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Изучите преимущества подписки, просмотрите учебные курсы, узнайте, как защитить свое устройство и т. д.

В сообществах можно задавать вопросы и отвечать на них, отправлять отзывы и консультироваться с экспертами разных профилей.