Accedi con Microsoft
Accedi o crea un account.
Salve,
Seleziona un altro account.
Hai più account
Scegli l'account con cui vuoi accedere.

In questo articolo viene descritto come eseguire uno script di rivoluzione R Enterprise in un cluster Hadoop da un client Windows all'esterno del cluster utilizzando ssh in un ambiente Cygwin.

  1. Installare e configurare Enterprise R rivoluzione 7.3 del cluster Hadoop per la Guida alla configurazione di rivoluzione R aziendale 7.3 Hadoop. Verificare il funzionamento di RRE del cluster quando lo script viene eseguito all'interno del cluster utilizzando lo script di convalida dalla sezione 4.

  2. Installare rivoluzione R Enterprise per Windows 7.3 sul sistema di Windows client.

  3. Installare l'ambiente Cygwin sul client del sistema Windows, assicurandosi di includere il ssh componenti client. Verificare ssh funzionalità di accesso dell'utente R/Hadoop dal sistema client Windows.

  4. Configurare passwordless ssh per la R/Hadoop utente creando un ssh keypair sul client e sul namenode di Hadoop per l'utente. Informazioni su questa operazione sono disponibili qui:

    http://inside.mines.edu/fs_home/gmurray/HowTo/sshNotes.html

    o ottenere assistenza dal gruppo IT necessarie per conformarsi ai requisiti di protezione. Salvare la chiave privata .pem sul client Windows. Ad esempio, "C:\data\hdp.pem".

  5. Verificare manualmente l'accesso dell'utente R passwordless (ex: scott) da un Cygwin bash la namenode utilizzando la chiave di sessione:

    $ ssh -i c:/data/hdp.pem scott@<namenode hostname or ip>
  6. Se l'account di accesso di test manuale viene eseguita correttamente, modificare il contesto di elaborazione Hadoop utilizzato quando si esegue lo script all'interno del cluster per includere ssh le informazioni di connessione richieste dal client. Per esempio:

    Hadoop base calcolare contesto utilizzato durante l'esecuzione dello script da un nodo del cluster

    myHadoopCluster <- RxHadoopMR(consoleOutput = TRUE)
    cluster <- rxSetComputeContext(myHadoopCluster)


    Esteso hadoop compute contesto utilizzato durante l'esecuzione dello script da un client Windows tramite Cygwin ssh.

    mySshUsername <- "scott"mySshHostname <- "<namenode hostname or ip>"

    myShareDir <- paste("/var/RevoShare", mySshUsername, sep ="/")
    myHdfsShareDir <- paste("/user/RevoShare",mySshUsername, sep="/")

    myHadoopCluster <- RxHadoopMR(
        hdfsShareDir = myHdfsShareDir,
        shareDir = myShareDir,
        sshUsername = mySshUsername,
        sshHostname = mySshHostname,
        sshSwitches = "-i c:\\data\\hdp.pem",
        consoleOutput = TRUE)

    cluster <- rxSetComputeContext(myHadoopCluster)

    Il valore di sshSwitches può essere utilizzato per inviare altri argomenti in base alle esigenze per il ssh client, ad esempio non predefinita porta ssh.

  7. Verificare lo script di R da Enterprise R rivoluzione sul client Windows. Lo script utilizza la connessione di Cygwin ssh client in background di inviare lo script per l'esecuzione di namenode.

Vedere RevoScaleR Hadoop Guida introduttiva per ulteriori informazioni.

Serve aiuto?

Vuoi altre opzioni?

Esplorare i vantaggi dell'abbonamento e i corsi di formazione, scoprire come proteggere il dispositivo e molto altro ancora.

Le community aiutano a porre e a rispondere alle domande, a fornire feedback e ad ascoltare gli esperti con approfondite conoscenze.

Queste informazioni sono risultate utili?

Come valuti la qualità della lingua?
Cosa ha influito sulla tua esperienza?
Premendo Inviare, il tuo feedback verrà usato per migliorare i prodotti e i servizi Microsoft. L'amministratore IT potrà raccogliere questi dati. Informativa sulla privacy.

Grazie per il feedback!

×