Kuinka asentaa Hadoop vaiheittaisella konfiguraatiolla Linuxiin Ubuntu

Tรคssรค opetusohjelmassa opastamme sinut vaihe vaiheelta, kuinka voit asentaa Apache Hadoopin Linux-laatikkoon (Ubuntu). Tรคmรค on 2-osainen prosessi

On 2 Edellytykset

Osa 1) Lataa ja asenna Hadoop

Vaihe 1) Lisรครค Hadoop-jรคrjestelmรคn kรคyttรคjรค kรคyttรคmรคllรค alla olevaa komentoa

sudo addgroup hadoop_

Lataa ja asenna Hadoop

sudo adduser --ingroup hadoop_ hduser_

Lataa ja asenna Hadoop

Anna salasanasi, nimesi ja muut tiedot.

HUOMAUTUS: Tรคssรค asennus- ja asennusprosessissa saattaa olla alla mainittu virhe.

"hduser ei ole sudoers-tiedostossa. Tรคstรค tapauksesta tiedotetaan."

Lataa ja asenna Hadoop

Tรคmรค virhe voidaan korjata kirjautumalla sisรครคn pรครคkรคyttรคjรคnรค

Lataa ja asenna Hadoop

Suorita komento

sudo adduser hduser_ sudo

Lataa ja asenna Hadoop

Re-login as hduser_

Lataa ja asenna Hadoop

Vaihe 2) Mรครคritรค SSH

Klusterin solmujen hallitsemiseksi Hadoop vaatii SSH-kรคyttรถoikeuden

Vaihda ensin kรคyttรคjรครค ja anna seuraava komento

su - hduser_

Lataa ja asenna Hadoop

Tรคmรค komento luo uuden avaimen.

ssh-keygen -t rsa -P ""

Lataa ja asenna Hadoop

Salli SSH-pรครคsy paikalliseen koneeseen tรคllรค nรคppรคimellรค.

cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys

Lataa ja asenna Hadoop

Testaa nyt SSH-asetuksia muodostamalla yhteys localhostiin hduser-kรคyttรคjรคnรค.

ssh localhost

Lataa ja asenna Hadoop

Huomautus: Huomaa, ettรค jos nรคet alla virheen vastauksena 'ssh localhost', on mahdollista, ettรค SSH ei ole kรคytettรคvissรค tรคssรค jรคrjestelmรคssรค-

Lataa ja asenna Hadoop

Tรคmรคn ratkaisemiseksi -

Tyhjennรค SSH kรคyttรคmรคllรค

sudo apt-get purge openssh-server

On hyvรค kรคytรคntรถ puhdistaa ennen asennuksen aloittamista

Lataa ja asenna Hadoop

Asenna SSH komennolla-

sudo apt-get install openssh-server

Lataa ja asenna Hadoop

Vaihe 3) Seuraava askel on Lataa Hadoop

Lataa ja asenna Hadoop

Valitse Vakaa

Lataa ja asenna Hadoop

Valitse tar.gz-tiedosto (ei src-tiedostoa)

Lataa ja asenna Hadoop

Kun lataus on valmis, siirry tar-tiedoston sisรคltรคvรครคn hakemistoon

Lataa ja asenna Hadoop

Enter,

sudo tar xzf hadoop-2.2.0.tar.gz

Lataa ja asenna Hadoop

Nimeรค nyt hadoop-2.2.0 uudelleen nimellรค hadoop

sudo mv hadoop-2.2.0 hadoop

Lataa ja asenna Hadoop

sudo chown -R hduser_:hadoop_ hadoop

Lataa ja asenna Hadoop

Osa 2) Mรครคritรค Hadoop

Vaihe 1) Muuttaa ~ / .bashrc tiedosto

Lisรครค seuraavat rivit tiedoston loppuun ~ / .bashrc

#Set HADOOP_HOME
export HADOOP_HOME=<Installation Directory of Hadoop>
#Set JAVA_HOME
export JAVA_HOME=<Installation Directory of Java>
# Add bin/ directory of Hadoop to PATH
export PATH=$PATH:$HADOOP_HOME/bin

Mรครคritรค Hadoop

Hanki nyt tรคmรค ympรคristรถkokoonpano kรคyttรคmรคllรค alla olevaa komentoa

. ~/.bashrc

Mรครคritรค Hadoop

Vaihe 2) HDFS:รครคn liittyvรคt mรครคritykset

Asettaa JAVA_HOME tiedoston sisรคllรค $HADOOP_HOME/etc/hadoop/hadoop-env.sh

Mรครคritรค Hadoop

Mรครคritรค Hadoop

Kanssa

Mรครคritรค Hadoop

Siinรค on kaksi parametria $HADOOP_HOME/etc/hadoop/core-site.xml jotka on asetettava -

1. "hadoop.tmp.dir" โ€“ Kรคytetรครคn mรครคrittรคmรครคn hakemisto, jota Hadoop kรคyttรครค datatiedostojensa tallentamiseen.

2. 'fs.default.name' โ€“ Tรคmรค mรครคrittรครค oletustiedostojรคrjestelmรคn.

Aseta nรคmรค parametrit avaamalla core-site.xml

sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml

Mรครคritรค Hadoop

Kopioi alla oleva rivi tunnisteiden vรคliin

<property>
<name>hadoop.tmp.dir</name>
<value>/app/hadoop/tmp</value>
<description>Parent directory for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS </name>
<value>hdfs://localhost:54310</value>
<description>The name of the default file system. </description>
</property>

Mรครคritรค Hadoop

Siirry hakemistoon $HADOOP_HOME/etc/Hadoop

Mรครคritรค Hadoop

Luo nyt tiedostossa core-site.xml mainittu hakemisto

sudo mkdir -p <Path of Directory used in above setting>

Mรครคritรค Hadoop

Myรถnnรค kรคyttรถoikeudet hakemistoon

sudo chown -R hduser_:Hadoop_ <Path of Directory created in above step>

Mรครคritรค Hadoop

sudo chmod 750 <Path of Directory created in above step>

Mรครคritรค Hadoop

Vaihe 3) Kartta Vรคhennรค kokoonpanoa

Ennen kuin aloitat nรคiden asetusten tekemisen, mรครคritetรครคn HADOOP_HOME-polku

sudo gedit /etc/profile.d/hadoop.sh

Ja Enter

export HADOOP_HOME=/home/guru99/Downloads/Hadoop

Mรครคritรค Hadoop

Seuraavaksi syรถtรค

sudo chmod +x /etc/profile.d/hadoop.sh

Mรครคritรค Hadoop

Poistu terminaalista ja kรคynnistรค uudelleen

Kirjoita echo $HADOOP_HOME. Polun tarkistamiseksi

Mรครคritรค Hadoop

Kopioi nyt tiedostot

sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml

Mรครคritรค Hadoop

Avaa mapred-site.xml tiedosto

sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml

Mรครคritรค Hadoop

Lisรครค alle asetusrivit tunnisteiden vรคliin ja

<property>
<name>mapreduce.jobtracker.address</name>
<value>localhost:54311</value>
<description>MapReduce job tracker runs at this host and port.
</description>
</property>

Mรครคritรค Hadoop

avoin $HADOOP_HOME/etc/hadoop/hdfs-site.xml kuten alla,

sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml

Mรครคritรค Hadoop

Lisรครค alle asetusrivit tunnisteiden vรคliin ja

<property>
<name>dfs.replication</name>
<value>1</value>
<description>Default block replication.</description>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hduser_/hdfs</value>
</property>

Mรครคritรค Hadoop

Luo yllรค olevassa asetuksessa mรครคritetty hakemisto -

sudo mkdir -p <Path of Directory used in above setting>
sudo mkdir -p /home/hduser_/hdfs

Mรครคritรค Hadoop

sudo chown -R hduser_:hadoop_ <Path of Directory created in above step>
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs

Mรครคritรค Hadoop

sudo chmod 750 <Path of Directory created in above step>
sudo chmod 750 /home/hduser_/hdfs

Mรครคritรค Hadoop

Vaihe 4) Ennen kuin kรคynnistรคmme Hadoopin ensimmรคistรค kertaa, alusta HDFS alla olevalla komennolla

$HADOOP_HOME/bin/hdfs namenode -format

Mรครคritรค Hadoop

Vaihe 5) Kรคynnistรค Hadoop yhden solmun klusteri kรคyttรคmรคllรค alla olevaa komentoa

$HADOOP_HOME/sbin/start-dfs.sh

Yllรค olevan komennon tulos

Mรครคritรค Hadoop

$HADOOP_HOME/sbin/start-yarn.sh

Mรครคritรค Hadoop

Kรคyttรคminen "jps" tyรถkalu/komento, tarkista, ovatko kaikki Hadoopiin liittyvรคt prosessit kรคynnissรค vai eivรคt.

Mรครคritรค Hadoop

Jos Hadoop on kรคynnistynyt onnistuneesti, jps:n lรคhdรถssรค pitรคisi nรคkyรค NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode.

Vaihe 6) stopping Hadoop

$HADOOP_HOME/sbin/stop-dfs.sh

Mรครคritรค Hadoop

$HADOOP_HOME/sbin/stop-yarn.sh

Mรครคritรค Hadoop

Tiivistรค tรคmรค viesti seuraavasti: