No contexto do computador local, todas as fontes de dados suportadas do RevoScaleR estão disponíveis para você. Em um contexto de computação distribuída, no entanto, sua escolha de fontes de dados pode ser muito limitada.
O caso mais extremo é o contexto de computação RxInTeradata, que oferece suporte somente a fonte de dados RxTeradata — isso faz sentido, pois os cálculos estão sendo feitos nos dados dentro do banco de dados Teradata.
A tabela a seguir mostra as combinações disponíveis de computação contextos e fontes de dados (x indica disponível):
Calcular o contexto → |
RxLocalSeq/Parallel |
RxHpcServer |
RxLsfCluster |
RxHadoopMR |
RxInTeradata |
Texto delimitado (RxTextData) |
x |
x |
x |
x |
|
Texto de formato fixo (RxTextData) |
x |
x |
x |
||
arquivos de dados de .xdf (RxXdfData) |
x |
x |
x |
x |
|
Arquivos de dados do SAS (RxSasData) |
x |
x |
x |
||
Arquivos de dados SPSS (RxSpssData) |
x |
x |
x |
||
Dados ODBC (RxOdbcData) |
x |
x |
x |
||
Banco de dados Teradata (RxTeradata) |
x |
x |
x |
x |
Para obter mais informações - consulte o guia de computação distribuída RevoScaleR