Kuinka asentaa Hadoop vaiheittaisella konfiguraatiolla Linuxiin Ubuntu
Tรคssรค opetusohjelmassa opastamme sinut vaihe vaiheelta, kuinka voit asentaa Apache Hadoopin Linux-laatikkoon (Ubuntu). Tรคmรค on 2-osainen prosessi
On 2 Edellytykset
- Sinun tรคytyy olla Ubuntu asennetaan ja juokseminen
- Sinun tรคytyy olla Java Asennettu.
Osa 1) Lataa ja asenna Hadoop
Vaihe 1) Lisรครค Hadoop-jรคrjestelmรคn kรคyttรคjรค kรคyttรคmรคllรค alla olevaa komentoa
sudo addgroup hadoop_
sudo adduser --ingroup hadoop_ hduser_
Anna salasanasi, nimesi ja muut tiedot.
HUOMAUTUS: Tรคssรค asennus- ja asennusprosessissa saattaa olla alla mainittu virhe.
"hduser ei ole sudoers-tiedostossa. Tรคstรค tapauksesta tiedotetaan."
Tรคmรค virhe voidaan korjata kirjautumalla sisรครคn pรครคkรคyttรคjรคnรค
Suorita komento
sudo adduser hduser_ sudo
Re-login as hduser_
Vaihe 2) Mรครคritรค SSH
Klusterin solmujen hallitsemiseksi Hadoop vaatii SSH-kรคyttรถoikeuden
Vaihda ensin kรคyttรคjรครค ja anna seuraava komento
su - hduser_
Tรคmรค komento luo uuden avaimen.
ssh-keygen -t rsa -P ""
Salli SSH-pรครคsy paikalliseen koneeseen tรคllรค nรคppรคimellรค.
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
Testaa nyt SSH-asetuksia muodostamalla yhteys localhostiin hduser-kรคyttรคjรคnรค.
ssh localhost
Huomautus: Huomaa, ettรค jos nรคet alla virheen vastauksena 'ssh localhost', on mahdollista, ettรค SSH ei ole kรคytettรคvissรค tรคssรค jรคrjestelmรคssรค-
Tรคmรคn ratkaisemiseksi -
Tyhjennรค SSH kรคyttรคmรคllรค
sudo apt-get purge openssh-server
On hyvรค kรคytรคntรถ puhdistaa ennen asennuksen aloittamista
Asenna SSH komennolla-
sudo apt-get install openssh-server
Vaihe 3) Seuraava askel on Lataa Hadoop
Valitse Vakaa
Valitse tar.gz-tiedosto (ei src-tiedostoa)
Kun lataus on valmis, siirry tar-tiedoston sisรคltรคvรครคn hakemistoon
Enter,
sudo tar xzf hadoop-2.2.0.tar.gz
Nimeรค nyt hadoop-2.2.0 uudelleen nimellรค hadoop
sudo mv hadoop-2.2.0 hadoop
sudo chown -R hduser_:hadoop_ hadoop
Osa 2) Mรครคritรค Hadoop
Vaihe 1) Muuttaa ~ / .bashrc tiedosto
Lisรครค seuraavat rivit tiedoston loppuun ~ / .bashrc
#Set HADOOP_HOME export HADOOP_HOME=<Installation Directory of Hadoop> #Set JAVA_HOME export JAVA_HOME=<Installation Directory of Java> # Add bin/ directory of Hadoop to PATH export PATH=$PATH:$HADOOP_HOME/bin
Hanki nyt tรคmรค ympรคristรถkokoonpano kรคyttรคmรคllรค alla olevaa komentoa
. ~/.bashrc
Vaihe 2) HDFS:รครคn liittyvรคt mรครคritykset
Asettaa JAVA_HOME tiedoston sisรคllรค $HADOOP_HOME/etc/hadoop/hadoop-env.sh
Kanssa
Siinรค on kaksi parametria $HADOOP_HOME/etc/hadoop/core-site.xml jotka on asetettava -
1. "hadoop.tmp.dir" โ Kรคytetรครคn mรครคrittรคmรครคn hakemisto, jota Hadoop kรคyttรครค datatiedostojensa tallentamiseen.
2. 'fs.default.name' โ Tรคmรค mรครคrittรครค oletustiedostojรคrjestelmรคn.
Aseta nรคmรค parametrit avaamalla core-site.xml
sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml
Kopioi alla oleva rivi tunnisteiden vรคliin
<property> <name>hadoop.tmp.dir</name> <value>/app/hadoop/tmp</value> <description>Parent directory for other temporary directories.</description> </property> <property> <name>fs.defaultFS </name> <value>hdfs://localhost:54310</value> <description>The name of the default file system. </description> </property>
Siirry hakemistoon $HADOOP_HOME/etc/Hadoop
Luo nyt tiedostossa core-site.xml mainittu hakemisto
sudo mkdir -p <Path of Directory used in above setting>
Myรถnnรค kรคyttรถoikeudet hakemistoon
sudo chown -R hduser_:Hadoop_ <Path of Directory created in above step>
sudo chmod 750 <Path of Directory created in above step>
Vaihe 3) Kartta Vรคhennรค kokoonpanoa
Ennen kuin aloitat nรคiden asetusten tekemisen, mรครคritetรครคn HADOOP_HOME-polku
sudo gedit /etc/profile.d/hadoop.sh
Ja Enter
export HADOOP_HOME=/home/guru99/Downloads/Hadoop
Seuraavaksi syรถtรค
sudo chmod +x /etc/profile.d/hadoop.sh
Poistu terminaalista ja kรคynnistรค uudelleen
Kirjoita echo $HADOOP_HOME. Polun tarkistamiseksi
Kopioi nyt tiedostot
sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml
Avaa mapred-site.xml tiedosto
sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml
Lisรครค alle asetusrivit tunnisteiden vรคliin ja
<property> <name>mapreduce.jobtracker.address</name> <value>localhost:54311</value> <description>MapReduce job tracker runs at this host and port. </description> </property>
avoin $HADOOP_HOME/etc/hadoop/hdfs-site.xml kuten alla,
sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml
Lisรครค alle asetusrivit tunnisteiden vรคliin ja
<property> <name>dfs.replication</name> <value>1</value> <description>Default block replication.</description> </property> <property> <name>dfs.datanode.data.dir</name> <value>/home/hduser_/hdfs</value> </property>
Luo yllรค olevassa asetuksessa mรครคritetty hakemisto -
sudo mkdir -p <Path of Directory used in above setting>
sudo mkdir -p /home/hduser_/hdfs
sudo chown -R hduser_:hadoop_ <Path of Directory created in above step>
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs
sudo chmod 750 <Path of Directory created in above step>
sudo chmod 750 /home/hduser_/hdfs
Vaihe 4) Ennen kuin kรคynnistรคmme Hadoopin ensimmรคistรค kertaa, alusta HDFS alla olevalla komennolla
$HADOOP_HOME/bin/hdfs namenode -format
Vaihe 5) Kรคynnistรค Hadoop yhden solmun klusteri kรคyttรคmรคllรค alla olevaa komentoa
$HADOOP_HOME/sbin/start-dfs.sh
Yllรค olevan komennon tulos
$HADOOP_HOME/sbin/start-yarn.sh
Kรคyttรคminen "jps" tyรถkalu/komento, tarkista, ovatko kaikki Hadoopiin liittyvรคt prosessit kรคynnissรค vai eivรคt.
Jos Hadoop on kรคynnistynyt onnistuneesti, jps:n lรคhdรถssรค pitรคisi nรคkyรค NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode.
Vaihe 6) stopping Hadoop
$HADOOP_HOME/sbin/stop-dfs.sh
$HADOOP_HOME/sbin/stop-yarn.sh





























