A Hadoop telepítése lépésről lépésre történő konfigurációval Linuxon Ubuntu

Ebben az oktatóanyagban lépésről lépésre végigvezetjük az Apache Hadoop Linux-dobozra való telepítésének folyamatán (Ubuntu). Ez 2 részes folyamat

Vannak 2 Előfeltételek

1. rész) Töltse le és telepítse a Hadoop programot

Step 1) Adjon hozzá egy Hadoop rendszerfelhasználót az alábbi paranccsal

sudo addgroup hadoop_

Töltse le és telepítse a Hadoop programot

sudo adduser --ingroup hadoop_ hduser_

Töltse le és telepítse a Hadoop programot

Adja meg jelszavát, nevét és egyéb adatait.

JEGYZET: Ebben a beállítási és telepítési folyamatban előfordulhat az alább említett hiba.

"hduser nincs a sudoers fájlban. Erről az esetről beszámolunk.”

Töltse le és telepítse a Hadoop programot

Ezt a hibát root felhasználóként való bejelentkezéssel lehet megoldani

Töltse le és telepítse a Hadoop programot

Végezzük el a parancsot

sudo adduser hduser_ sudo

Töltse le és telepítse a Hadoop programot

Re-login as hduser_

Töltse le és telepítse a Hadoop programot

Step 2) SSH konfigurálása

A fürt csomópontjainak kezeléséhez a Hadoop SSH-hozzáférést igényel

Először váltson felhasználót, írja be a következő parancsot

su - hduser_

Töltse le és telepítse a Hadoop programot

Ez a parancs új kulcsot hoz létre.

ssh-keygen -t rsa -P ""

Töltse le és telepítse a Hadoop programot

Engedélyezze az SSH-hozzáférést a helyi géphez ezzel a kulccsal.

cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys

Töltse le és telepítse a Hadoop programot

Most tesztelje az SSH beállítását úgy, hogy "hduser" felhasználóként csatlakozik a localhosthoz.

ssh localhost

Töltse le és telepítse a Hadoop programot

Jegyzet: Kérjük, vegye figyelembe, hogy ha az alábbi hibaüzenetet látja az 'ssh localhost' válaszában, akkor lehetséges, hogy az SSH nem érhető el ezen a rendszeren.

Töltse le és telepítse a Hadoop programot

Ennek megoldására –

Törölje ki az SSH-t a

sudo apt-get purge openssh-server

Jó gyakorlat a telepítés megkezdése előtt átöblíteni

Töltse le és telepítse a Hadoop programot

Telepítse az SSH-t a következő paranccsal

sudo apt-get install openssh-server

Töltse le és telepítse a Hadoop programot

Step 3) A következő lépés az Töltse le a Hadoop-ot

Töltse le és telepítse a Hadoop programot

Válassza a Stabil lehetőséget

Töltse le és telepítse a Hadoop programot

Válassza ki a tar.gz fájlt (ne az src-t tartalmazó fájlt)

Töltse le és telepítse a Hadoop programot

A letöltés befejezése után keresse meg a tar fájlt tartalmazó könyvtárat

Töltse le és telepítse a Hadoop programot

Enter,

sudo tar xzf hadoop-2.2.0.tar.gz

Töltse le és telepítse a Hadoop programot

Most nevezze át a hadoop-2.2.0-t hadoop névre

sudo mv hadoop-2.2.0 hadoop

Töltse le és telepítse a Hadoop programot

sudo chown -R hduser_:hadoop_ hadoop

Töltse le és telepítse a Hadoop programot

2. rész) A Hadoop konfigurálása

Step 1) módosít ~ / .bashrc filé

Adja hozzá a következő sorokat a fájl végéhez ~ / .bashrc

#Set HADOOP_HOME
export HADOOP_HOME=<Installation Directory of Hadoop>
#Set JAVA_HOME
export JAVA_HOME=<Installation Directory of Java>
# Add bin/ directory of Hadoop to PATH
export PATH=$PATH:$HADOOP_HOME/bin

A Hadoop konfigurálása

Most szerezze be ezt a környezetkonfigurációt az alábbi paranccsal

. ~/.bashrc

A Hadoop konfigurálása

Step 2) A HDFS-hez kapcsolódó konfigurációk

Készlet JAVA_HOME belső fájl $HADOOP_HOME/etc/hadoop/hadoop-env.sh

A Hadoop konfigurálása

A Hadoop konfigurálása

A

A Hadoop konfigurálása

Két paraméter van benne $HADOOP_HOME/etc/hadoop/core-site.xml amelyeket be kell állítani -

1. „hadoop.tmp.dir” – Egy könyvtár megadására szolgál, amelyet a Hadoop az adatfájlok tárolására fog használni.

2. „fs.default.name” – Ez határozza meg az alapértelmezett fájlrendszert.

A paraméterek beállításához nyissa meg a core-site.xml fájlt

sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml

A Hadoop konfigurálása

Másolja a címkék közé az alábbi sor alá

<property>
<name>hadoop.tmp.dir</name>
<value>/app/hadoop/tmp</value>
<description>Parent directory for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS </name>
<value>hdfs://localhost:54310</value>
<description>The name of the default file system. </description>
</property>

A Hadoop konfigurálása

Navigáljon a könyvtárhoz $HADOOP_HOME/etc/Hadoop

A Hadoop konfigurálása

Most hozza létre a core-site.xml fájlban említett könyvtárat

sudo mkdir -p <Path of Directory used in above setting>

A Hadoop konfigurálása

Engedélyek megadása a könyvtárnak

sudo chown -R hduser_:Hadoop_ <Path of Directory created in above step>

A Hadoop konfigurálása

sudo chmod 750 <Path of Directory created in above step>

A Hadoop konfigurálása

Step 3) Térkép Konfiguráció csökkentése

Mielőtt elkezdené ezeket a konfigurációkat, állítsa be a HADOOP_HOME elérési utat

sudo gedit /etc/profile.d/hadoop.sh

És Enter

export HADOOP_HOME=/home/guru99/Downloads/Hadoop

A Hadoop konfigurálása

Következő belépés

sudo chmod +x /etc/profile.d/hadoop.sh

A Hadoop konfigurálása

Lépjen ki a terminálból, és indítsa újra

Írja be: echo $HADOOP_HOME. Az útvonal ellenőrzéséhez

A Hadoop konfigurálása

Most másolja a fájlokat

sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml

A Hadoop konfigurálása

Nyissa meg a mapred-site.xml filé

sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml

A Hadoop konfigurálása

Adja hozzá a beállítási sorokat a címkék közé és

<property>
<name>mapreduce.jobtracker.address</name>
<value>localhost:54311</value>
<description>MapReduce job tracker runs at this host and port.
</description>
</property>

A Hadoop konfigurálása

Nyisd ki $HADOOP_HOME/etc/hadoop/hdfs-site.xml az alábbi,

sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml

A Hadoop konfigurálása

Adja hozzá a beállítási sorokat a címkék közé és

<property>
<name>dfs.replication</name>
<value>1</value>
<description>Default block replication.</description>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hduser_/hdfs</value>
</property>

A Hadoop konfigurálása

Hozzon létre egy könyvtárat a fenti beállításban -

sudo mkdir -p <Path of Directory used in above setting>
sudo mkdir -p /home/hduser_/hdfs

A Hadoop konfigurálása

sudo chown -R hduser_:hadoop_ <Path of Directory created in above step>
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs

A Hadoop konfigurálása

sudo chmod 750 <Path of Directory created in above step>
sudo chmod 750 /home/hduser_/hdfs

A Hadoop konfigurálása

Step 4) A Hadoop első elindítása előtt formázza meg a HDFS-t az alábbi paranccsal

$HADOOP_HOME/bin/hdfs namenode -format

A Hadoop konfigurálása

Step 5) Indítsa el a Hadoop egycsomópont-fürtöt az alábbi paranccsal

$HADOOP_HOME/sbin/start-dfs.sh

A fenti parancs kimenete

A Hadoop konfigurálása

$HADOOP_HOME/sbin/start-yarn.sh

A Hadoop konfigurálása

<p></p> "jps" eszközt/parancsot, ellenőrizze, hogy az összes Hadoop-hoz kapcsolódó folyamat fut-e vagy sem.

A Hadoop konfigurálása

Ha a Hadoop sikeresen elindult, akkor a jps kimenetén a NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode jelenik meg.

Step 6) A Hadoop leállítása

$HADOOP_HOME/sbin/stop-dfs.sh

A Hadoop konfigurálása

$HADOOP_HOME/sbin/stop-yarn.sh

A Hadoop konfigurálása