Problema
É possível executar consultas SQL em um .xdf de leitura em RevoR e executando SQL dentro de RevoR?
Solução
Não é possível executar SQL na leitura do arquivo .xdf, que é um arquivo binário que contém dados e não um banco de dados. O que nos permite trabalhar com esses dados grandes é que podemos ler "blocos" do .xdf e o que nos permite aproveitar os recursos de disco além dos recursos de memória e nos permite manipular dados grandes.
Opções-
Uma vez que o arquivo xdf é criado pela RevoR, você pode executar SQL nos dados quando vem em RevoR, adicionando uma consulta SQL para RxOdbcData. Um exemplo seria:
foo <-RxOdbcData (sqlQuery = "Selecione * de foo_database",
connectionString = connectionString)
Claro que você precisará ter uma conexão ODBC válida. O guia de importação de ODBC RevoScaleR tem informações sobre isso.
Outra opção é usar o rxDataStep para transformar os dados do xdf em um dataframe. Um dataframe deve ser mantido na memória para que isso não pode ser uma opção se você tiver arquivos extremamente grandes .xdf. Em seguida, você pode usar um pacote de código-fonte aberto chamado sqldf que permite que você use SQL seleciona em dataframes.