Проблема
Имеется возможность выполнять запросы SQL на .xdf в RevoR и выполнение SQL внутри RevoR?
Решение
Не удается запустить SQL на чтение файла .xdf как это двоичный файл, который содержит данные и не базы данных. Что позволяет нам работать с таким большим объемом данных является, мы могли прочитать «фрагментов» .xdf и что позволяет нам использовать дисковые ресурсы, а также ресурсы памяти и позволяет управлять большие объемы данных.
Параметры-
С момента создания файла xdf, RevoR можно выполнить SQL данных когда они приходят в RevoR путем добавления запроса SQL RxOdbcData. Пример будет выглядеть:
foo <-RxOdbcData (sqlQuery = "SELECT * из foo_database",
connectionString = connectionString)
Конечно же необходимо иметь действующее подключение ODBC. Руководство RevoScaleR ODBC импорта содержит информацию об этом.
Другим вариантом является использование rxDataStep для преобразования данных в xdf в dataframe. Dataframe должен храниться в памяти, поэтому это может быть параметр при наличии .xdf очень больших файлов. Затем можно использовать пакет с открытым исходным кодом, называемый sqldf, который позволяет использовать SQL выбирает на dataframes.