Logga in med Microsoft
Logga in eller skapa ett konto.
Hej,
Välj ett annat konto.
Du har flera konton
Välj det konto som du vill logga in med.

Den här artikeln beskrivs hur du kör ett skript för revolutionen R Enterprise i ett Hadoop-kluster från en Windows-klient utanför klustret med en bläck ssh klienten.

  1. Installera och konfigurera Revolution R Enterprise 7.3 i Hadoop-kluster per Varv R Enterprise 7.3 Hadoop konfigurationsguiden. Kontrollera driften av RRE i klustret när skriptet körs i klustret med hjälp av validering-skript från avsnitt 4.

  2. Installera Revolution R Enterprise för Windows 7.3 på klienten Windows system.

  3. Installera bläck ssh-klienten på Windows system-klienten. Kontrollera ssh inloggning kapacitet för R/Hadoop användaren från Windows-klienten på datorn.

  4. Konfigurera passwordless ssh för R/Hadoop-användare genom att skapa en ssh nyckelpar på klienten och på Hadoop-namenode för användaren. Information om hur du gör detta hittar du här:

    https://cs.uwaterloo.ca/cscf/howto/ssh/public_key/#putty

    eller få hjälp från IT-grupp som behövs för att uppfylla säkerhetskraven. Spara .ppk privata nyckel på Windows-klienten. Till exempel "C:\data\hdp.ppk".

  5. Skapa och spara en namngiven spackel session för inloggningen från klienten till Hadoop-namenode spackel-klienten. Till exempel "RREHDP".

  6. Kontrollera manuellt passwordless inloggning och användaren R (ex: Glenn) med det bläck plink.exe verktyg, sparade sessionen och nyckeln:

    "C:\\Program Files (x86)\\PuTTY\\plink.exe" -i C:\data\hdp.ppk -l scott -load RREHDP
  7. Om plink.exe test inloggningen lyckas ändra kontexten Hadoop beräkna används när du kör skriptet från klustret med ssh anslutningsinformation som krävs av klienten. Till exempel:

    Grundläggande hadoop beräkna sammanhang som används när du kör skriptet från en klusternod

    myHadoopCluster <- RxHadoopMR(consoleOutput = TRUE)
    cluster <- rxSetComputeContext(myHadoopCluster)

    Utökad hadoop beräkna sammanhang som används när du kör skriptet från en Windows-klient via bläck. Observera när du använder bläck, mySshHostname bör inte referera till namenode värdnamn. Informationen finns i den sparade spackel sessionen. MySshHostname bör anges till namnet på den sparade sessionen i skriptet.

    mySshUsername <- "scott"mySshHostname <- "RREHDP"

    myShareDir <- paste("/var/RevoShare", mySshUsername, sep ="/")
    myHdfsShareDir <- paste("/user/RevoShare",mySshUsername, sep="/")

    myHadoopCluster <- RxHadoopMR(
        hdfsShareDir = myHdfsShareDir,
        shareDir = myShareDir,
        sshUsername = mySshUsername,
        sshHostname = mySshHostname,
        sshClientDir = "C:\\Program Files (x86)\\PuTTY",
        sshSwitches = "-i c:\\data\\hdp.ppk",
        consoleOutput = TRUE)

    cluster <- rxSetComputeContext(myHadoopCluster)

    SshSwitches värde kan användas för att skicka andra argument som behövs för att den ssh klient, exempelvis en standard ssh port.

  8. Testa skriptet R från revolutionen R Enterprise på Windows-klienten. Skriptet ska ansluta med hjälp av bläck ssh klienten i bakgrunden för att skicka skript för körning på en namenode.

Se RevoScaleR Hadoop komma igång-Guide för mer information.

Behöver du mer hjälp?

Vill du ha fler alternativ?

Utforska prenumerationsförmåner, bläddra bland utbildningskurser, lär dig hur du skyddar din enhet med mera.

Communities hjälper dig att ställa och svara på frågor, ge feedback och få råd från experter med rika kunskaper.

Hade du nytta av den här informationen?

Hur nöjd är du med språkkvaliteten?
Vad påverkade din upplevelse?
Genom att trycka på skicka, kommer din feedback att användas för att förbättra Microsofts produkter och tjänster. IT-administratören kan samla in denna data. Sekretesspolicy.

Tack för din feedback!

×