Bảo đảm chất lượng: Làm thế nào tôi có thể ngẫu nhiên chọn dữ liệu từ một tập tin .xdf?

Bạn có thể sử dụng R 'chuyển đổi' chức để chuyển đổi dữ liệu qua chức năng đó RevoScaleR 'rxDataStepXdf()' hoạt động. Bạn có thể sử dụng tệp .xdf nhóm mới tạo, với các chức năng RevoScaleR. Dưới đây là một tập lệnh mẫu R tạo tệp .xdf mới bằng ngẫu nhiên mẫu tệp .xdf lớn bằng cách sử dụng biến lựa chọn hàng ẩn bằng 'transformFunc'.

# Create a transformFunc that selects 25% of the data at random set.seed(13) 
xform <- function(data) { 
data$.rxRowSelection<-as.logical(rbinom(length(data[[1]]),1,.25)) 
return(data) 

rxDataStepXdf(inFile=inFile, outFile="sampledData.xdf", transformFunc=xform, overwrite=TRUE) 
# check that subsetting was done and the row selection variable is not kept in the data set. 
rxGetInfoXdf(inFile) 
rxGetInfoXdf("sampledData.xdf") 

Bạn cần thêm trợ giúp?

Phát triển các kỹ năng của bạn
Khám phá nội dung đào tạo
Sở hữu tính năng mới đầu tiên
Tham gia Microsoft dùng nội bộ

Thông tin này có hữu ích không?

Cảm ơn phản hồi của bạn!

Cảm ơn bạn đã phản hồi! Để trợ giúp tốt hơn, có lẽ chúng tôi sẽ kết nối bạn với một trong những nhân viên hỗ trợ Office của chúng tôi.

×