Tento článek popisuje, jak spustit skript revoluce R Enterprise Hadoop cluster z klienta Windows mimo cluster pomocí ssh v prostředí softwaru Cygwin.
-
Nainstalujte a nakonfigurujte revoluce R Enterprise 7.3 za Revoluce R Enterprise 7.3 Hadoop Průvodce konfiguracíclusteru Hadoop. Ověřte operace RRE v clusteru při spuštění skriptu z v rámci clusteru pomocí ověřovacího skriptu z bodu 4.
-
Nainstalujte klienta systému Windows Enterprise revoluce R pro Windows 7.3.
-
Instalace softwaru Cygwin prostředí v klientském počítači systému Windows je nutné zahrnout ssh součásti klienta. Ověřte ssh možnost přihlášení uživatele R/Hadoop z klienta systému Windows.
-
Konfigurace passwordless ssh pro uživatele R/Hadoop vytvořením ssh keypair na straně klienta a na namenode Hadoop pro uživatele. Informace naleznete zde:http://inside.mines.edu/fs_home/gmurray/HowTo/sshNotes.htmlnebo získat pomoc z vaší skupiny IT, jak je nezbytné pro dosažení souladu s požadavky na zabezpečení. Uložte .pem soukromý klíč v klientském počítači systému Windows. Například, "C:\data\hdp.pem".
-
Ručně ověřte passwordless přihlášení uživatele R (ex: scott) z softwaru Cygwin flám namenode pomocí klíče relace:
$ ssh -i c:/data/hdp.pem scott@<namenode hostname or ip>
-
Pokud je úspěšné přihlášení ručního testu, změňte kontextu výpočetní Hadoop umožňuje zahrnout ssh klient potřebuje informace o připojení při spuštění skriptu z v rámci clusteru. Například:Základní hadoop vypočítat kontextu používá při spuštění skriptu v uzlu clusteru
myHadoopCluster <- RxHadoopMR(consoleOutput = TRUE)cluster <- rxSetComputeContext(myHadoopCluster)
Rozšířené místní výpočetní hadoop používá při spuštění skriptu z klienta se systémem Windows prostřednictvím softwaru Cygwin ssh.
mySshUsername <- "scott"mySshHostname <- "<namenode hostname or ip>"myShareDir <- paste("/var/RevoShare", mySshUsername, sep ="/")myHdfsShareDir <- paste("/user/RevoShare",mySshUsername, sep="/")myHadoopCluster <- RxHadoopMR( hdfsShareDir = myHdfsShareDir, shareDir = myShareDir, sshUsername = mySshUsername, sshHostname = mySshHostname, sshSwitches = "-i c:\\data\\hdp.pem", consoleOutput = TRUE)cluster <- rxSetComputeContext(myHadoopCluster)
Hodnotu sshSwitches lze podávat námitky podle potřeby ssh klienta, například jiné než výchozí ssh port.
-
Test skriptu R z R Enterprise revoluce na klienta systému Windows. Skript by měl připojit pomocí softwaru Cygwin ssh klient na pozadí odeslat skript pro spuštění na namenode.
V RevoScaleR Hadoop Příručka Začínáme pro další informace.