R '変換' 関数を使用するとデータを変換し、その関数を RevoScaleR 'rxDataStepXdf()' 関数に渡すことができます。他の RevoScaleR 関数を使用して、新しく作成された一部の .xdf ファイルを使用できます。'TransformFunc' で利用可能な非表示の行の選択範囲の変数を使用して大規模な .xdf ファイルをランダムにサンプリングして、新しい .xdf ファイルを作成する R のサンプル スクリプトを次に示します。
# Create a transformFunc that selects 25% of the data at random set.seed(13)
xform <- function(data) { data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) return(data) } rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) # check that subsetting was done and the row selection variable is not kept in the data set. rxGetInfoXdf(inFile) rxGetInfoXdf("sampledData.xdf")