Kuidas installida Hadoopi samm-sammult konfiguratsiooniga Linuxis Ubuntu

Selles õpetuses juhendame teid samm-sammult Apache Hadoopi installimiseks Linuxi kasti (Ubuntu). See on 2 osaline protsess

On 2 Eeldused

Osa 1) Laadige alla ja installige Hadoop

Step 1) Lisage Hadoopi süsteemi kasutaja, kasutades allolevat käsku

sudo addgroup hadoop_

Laadige alla ja installige Hadoop

sudo adduser --ingroup hadoop_ hduser_

Laadige alla ja installige Hadoop

Sisestage oma parool, nimi ja muud andmed.

MÄRKUS: Selles seadistus- ja installiprotsessis võib tekkida allpool nimetatud tõrge.

"hduser ei ole sudoersi failis. Sellest juhtumist teatatakse."

Laadige alla ja installige Hadoop

Selle vea saab lahendada juurkasutajana sisse logides

Laadige alla ja installige Hadoop

Käivitage käsk

sudo adduser hduser_ sudo

Laadige alla ja installige Hadoop

Re-login as hduser_

Laadige alla ja installige Hadoop

Step 2) Seadistage SSH

Klastris olevate sõlmede haldamiseks vajab Hadoop juurdepääsu SSH-le

Esmalt vahetage kasutajat ja sisestage järgmine käsk

su - hduser_

Laadige alla ja installige Hadoop

See käsk loob uue võtme.

ssh-keygen -t rsa -P ""

Laadige alla ja installige Hadoop

Lubage selle klahvi abil SSH-juurdepääs kohalikule masinale.

cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys

Laadige alla ja installige Hadoop

Nüüd testige SSH seadistust, luues ühenduse kohaliku hostiga kui "hduser" kasutaja.

ssh localhost

Laadige alla ja installige Hadoop

Märge: Pange tähele, et kui näete allpool tõrketeadet vastuseks 'ssh localhostile', siis on võimalik, et SSH pole selles süsteemis saadaval.

Laadige alla ja installige Hadoop

Selle lahendamiseks –

Puhastage SSH, kasutades

sudo apt-get purge openssh-server

Hea tava on puhastada enne paigaldamise algust

Laadige alla ja installige Hadoop

Installige SSH, kasutades käsku-

sudo apt-get install openssh-server

Laadige alla ja installige Hadoop

Step 3) Järgmine samm on Laadige alla Hadoop

Laadige alla ja installige Hadoop

Valige Stabiilne

Laadige alla ja installige Hadoop

Valige fail tar.gz (mitte src-ga fail)

Laadige alla ja installige Hadoop

Kui allalaadimine on lõppenud, liikuge tar-faili sisaldavasse kataloogi

Laadige alla ja installige Hadoop

sisesta,

sudo tar xzf hadoop-2.2.0.tar.gz

Laadige alla ja installige Hadoop

Nüüd nimetage hadoop-2.2.0 ümber hadoopiks

sudo mv hadoop-2.2.0 hadoop

Laadige alla ja installige Hadoop

sudo chown -R hduser_:hadoop_ hadoop

Laadige alla ja installige Hadoop

2. osa) Hadoopi konfigureerimine

Step 1) muutma ~ / .bashrc fail

Lisage faili lõppu järgmised read ~ / .bashrc

#Set HADOOP_HOME
export HADOOP_HOME=<Installation Directory of Hadoop>
#Set JAVA_HOME
export JAVA_HOME=<Installation Directory of Java>
# Add bin/ directory of Hadoop to PATH
export PATH=$PATH:$HADOOP_HOME/bin

Hadoopi seadistamine

Nüüd hankige see keskkonna konfiguratsioon alloleva käsu abil

. ~/.bashrc

Hadoopi seadistamine

Step 2) HDFS-iga seotud konfiguratsioonid

komplekt JAVA_HOME faili sees $HADOOP_HOME/etc/hadoop/hadoop-env.sh

Hadoopi seadistamine

Hadoopi seadistamine

koos

Hadoopi seadistamine

Sees on kaks parameetrit $HADOOP_HOME/etc/hadoop/core-site.xml mis tuleb seadistada -

1. „hadoop.tmp.dir” – Kasutatakse kataloogi määramiseks, mida Hadoop kasutab oma andmefailide salvestamiseks.

2. 'fs.default.name' – See määrab vaikefailisüsteemi.

Nende parameetrite määramiseks avage core-site.xml

sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml

Hadoopi seadistamine

Kopeerige allpool rida siltide vahele

<property>
<name>hadoop.tmp.dir</name>
<value>/app/hadoop/tmp</value>
<description>Parent directory for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS </name>
<value>hdfs://localhost:54310</value>
<description>The name of the default file system. </description>
</property>

Hadoopi seadistamine

Liikuge kataloogi $HADOOP_HOME/etc/Hadoop

Hadoopi seadistamine

Nüüd looge failis core-site.xml mainitud kataloog

sudo mkdir -p <Path of Directory used in above setting>

Hadoopi seadistamine

Andke kataloogile õigused

sudo chown -R hduser_:Hadoop_ <Path of Directory created in above step>

Hadoopi seadistamine

sudo chmod 750 <Path of Directory created in above step>

Hadoopi seadistamine

Step 3) Kaardi konfiguratsiooni vähendamine

Enne nende konfiguratsioonidega alustamist määrake HADOOP_HOME tee

sudo gedit /etc/profile.d/hadoop.sh

Ja Sisestage

export HADOOP_HOME=/home/guru99/Downloads/Hadoop

Hadoopi seadistamine

Järgmisena sisestage

sudo chmod +x /etc/profile.d/hadoop.sh

Hadoopi seadistamine

Väljuge terminalist ja taaskäivitage uuesti

Tippige echo $HADOOP_HOME. Tee kontrollimiseks

Hadoopi seadistamine

Nüüd kopeerige failid

sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml

Hadoopi seadistamine

avage mapred-site.xml fail

sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml

Hadoopi seadistamine

Lisage märgendite vahele allpool seadistusread ja

<property>
<name>mapreduce.jobtracker.address</name>
<value>localhost:54311</value>
<description>MapReduce job tracker runs at this host and port.
</description>
</property>

Hadoopi seadistamine

avatud $HADOOP_HOME/etc/hadoop/hdfs-site.xml nagu allpool,

sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml

Hadoopi seadistamine

Lisage märgendite vahele allpool seadistusread ja

<property>
<name>dfs.replication</name>
<value>1</value>
<description>Default block replication.</description>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hduser_/hdfs</value>
</property>

Hadoopi seadistamine

Looge ülaltoodud seadistuses määratud kataloog -

sudo mkdir -p <Path of Directory used in above setting>
sudo mkdir -p /home/hduser_/hdfs

Hadoopi seadistamine

sudo chown -R hduser_:hadoop_ <Path of Directory created in above step>
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs

Hadoopi seadistamine

sudo chmod 750 <Path of Directory created in above step>
sudo chmod 750 /home/hduser_/hdfs

Hadoopi seadistamine

Step 4) Enne Hadoopi esmakordset käivitamist vormindage HDFS alloleva käsu abil

$HADOOP_HOME/bin/hdfs namenode -format

Hadoopi seadistamine

Step 5) Käivitage Hadoopi ühe sõlme klaster, kasutades allolevat käsku

$HADOOP_HOME/sbin/start-dfs.sh

Ülaltoodud käsu väljund

Hadoopi seadistamine

$HADOOP_HOME/sbin/start-yarn.sh

Hadoopi seadistamine

Kasutamine 'jps' tööriist/käsk, kontrollige, kas kõik Hadoopiga seotud protsessid töötavad või mitte.

Hadoopi seadistamine

Kui Hadoop on edukalt käivitunud, peaks jps-i väljund näitama NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode.

Step 6) Hadoopi peatamine

$HADOOP_HOME/sbin/stop-dfs.sh

Hadoopi seadistamine

$HADOOP_HOME/sbin/stop-yarn.sh

Hadoopi seadistamine