您可以使用的 R '轉換' 函式來轉換資料,並將該函式傳遞給 RevoScaleR 'rxDataStepXdf()' 函數。然後,您就可以使用新建立的是,子集的.xdf 檔案與其他的 RevoScaleR 函式。以下是範例 R 指令碼可以建立新的.xdf 檔案隨機取樣較大的.xdf 檔案,使用隱藏的資料列的選取範圍變數 'transformFunc' 中可用。
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")