學習資源

思科

網絡工程

華為

網絡工程

紅帽

系統運維

RHCSA

RHCE

RHCA

OpenStack

RHCVA

RHCSS

甲骨文

數據庫

OCA

OCP

OCM

MySQL

微軟

系統運維

MTA

MCSA

MCSE

軟件開發

編程設計

Java

Android

HTML5

其他

Python

學習文章

當前位置：首頁 > >學習文章 > >

{hadoop-ha}集群搭建

發布時間： 2017-12-18 15:37:34

一、準備環境

1.修改Linux主機名

2.修改IP

3.修改主機名和IP的映射關系 /etc/hosts

4.配置yum源

5.安裝scp工具

[root@hdp01 yum.repos.d]# yum -y install openssh-clients

6.關閉防火墻

7.ssh免登陸

8.安裝JDK，配置環境變量等

二、集群規劃?

說明：

1.在hadoop2.x中通常由兩個NameNode組成，一個處于active狀態，另一個處于standby狀態。Active NameNode對外提供服務，而Standby NameNode則不對外提供服務，僅同步active namenode的狀態，以便能夠在它失敗時快速進行切換。

hadoop2.x官方提供了兩種HDFS HA的解決方案，一種是NFS，另一種是QJM。這里我們使用簡單的QJM。在該方案中，主備NameNode之間通過一組JournalNode同步元數據信息，一條數據只要成功寫入多數JournalNode即認為寫入成功。通常配置奇數個JournalNode

這里還配置了一個zookeeper集群，用于ZKFC（DFSZKFailoverController）故障轉移，當Active NameNode掛掉了，會自動切換Standby NameNode為standby狀態

2.hadoop-2.x中依然存在一個問題，就是ResourceManager只有一個，存在單點故障，hadoop-2.8.1解決了這個問題，有兩個ResourceManager，一個是Active，一個是Standby，狀態由zookeeper進行協調

一、安裝步驟

1. 安裝配置zooekeeper集群（在hdp05上）機器部署安裝到hdp05,hdp06,hdp07 3臺虛擬機上

安裝好JDK

上傳上傳zookeeper-3.4.11.tar.gz解壓su – hadoop（切換到hadoop用戶）

[hadoop@hdp05 ~]$ tar zxvf zookeeper-3.4.11.tar.gz -C apps（解壓）重命名[hadoop@hdp05 ~]$ mv zookeeper-3.4.11 zookeeper（重命名文件夾zookeeper-3.4.11為zookeeper）修改環境變量1、[hadoop@hdp05 ~]$ su – root(切換用戶到root)

2、[root@hdp05 ~]$ vi /etc/profile(修改文件)

3、添加內容：

ZOOKEEPER_HOME=/home/hadoop/apps/zookeeper

PATH=$ZOOKEEPER_HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export ZOOKEEPER_HOME HADOOP_HOME JAVA_HOME PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

4、重新編譯文件：

[root@hdp05 ~]$ source /etc/profile

5、注意：3臺zookeeper都需要修改

6、修改完成后切換回hadoop用戶：

[hadoop@hdp05 ~]$ su - hadoop

修改配置文件

1、用hadoop用戶操作

[hadoop@hdp05 ~]$ cd ~/apps/zookeeper/conf

[hadoop@hdp05 ~]$cp zoo_sample.cfg zoo.cfg

2、[hadoop@hdp05 ~]$vi zoo.cfg

3、添加內容：

dataDir=/home/hadoop/zookeeper/data

dataLogDir=/home/hadoop/zookeeper/log

server.1=slave1:2888:3888 (主機名, 心跳端口、數據端口)

server.2=slave2:2888:3888

server.3=slave3:2888:3888

4、創建文件夾：

[hadoop@hdp05 ~]$cd /home/hadoop/zookeeper/

[hadoop@hdp05 ~]$mkdir -m 755 data

[hadoop@hdp05 ~]$mkdir -m 755 log

5、在data文件夾下新建myid文件，myid的文件內容為：

[hadoop@hdp05 ~]$cd data

[hadoop@hdp05 ~]$vi myid

添加內容：

將集群下發到其他機器上：

[hadoop@hdp05 ~]$scp -r /home/hadoop/zookeeper hadoop@hdp06:/home/hadoop/

[hadoop@hdp05 ~]$scp -r /home/hadoop/zookeeper hadoop@hdp07:/home/hadoop/修改其他機器的配置文件到slave2上：修改myid為：2

到slave3上：修改myid為：3

啟動（每臺機器）

[hadoop@hdp05 ~]$zkServer.sh start

查看集群狀態

1、 [hadoop@hdp05 ~]$jps（查看進程）

2、 [hadoop@hdp05 ~]$zkServer.sh status（查看集群狀態，主從信息）

?1. 安裝配置hadoop集群

（在hdp01上操作）解壓[hadoop@hdp05 ~]$tar -zxvf hadoop-2.8.1.tar.gz -C /home/hadoop/apps/?

配置HDFS#將hadoop添加到環境變量中

[root@hdp05 ~]#vim /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_121

export HADOOP_HOME=/hadoop/hadoop-2.8.1

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin

修改配置文件

A. 修改hadoo-env.sh

export JAVA_HOME=/opt/jdk1.8.0_121

B. 修改core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/apps/hdpdata/</value>

</property>

<name>ha.zookeeper.quorum</name>

</property>

</configuration>

C. 修改hdfs-site.xml?

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.sha</name>

</property>

<name>dfs.namenode.rpc-address.sha.nn1</name>

</property>

<name>dfs.namenode.http-address.sha.nn1</name>

</property>

<name>dfs.namenode.rpc-address.sha.nn2</name>

</property>

<name>dfs.namenode.http-address.sha.nn2</name>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hdp05:8485;hdp06:8485;hdp07:8485/sha</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/hadoop/journaldata</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.sha</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

shell(/shan/true)

</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hadoop/.ssh/id_rsa</value>

</property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

</property>

</configuration>

D.修改mapred-site.xml??

<name>mapreduce.framework.name</name>

</property>

</configuration>

E.修改yarn-site.xml

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

</property>

<name>yarn.resourcemanager.zk-address</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

F. 修改slaves

slaves是指定子節點的位置，因為要在hdp01上啟動HDFS、在hdp03啟動yarn，所以hdp01上的slaves文件指定的是datanode的位置，hdp03上的slaves文件指定的是nodemanager的位置

hdp05

hdp06

hdp07

配置免密碼登陸

#首先要配置hdp01到hdp02、hdp03、hdp04、hdp05、hdp06、hdp07的免密碼登陸

#在hdp01上生產一對鑰匙

ssh-keygen -t rsa

#將公鑰拷貝到其他節點，包括自己

ssh-coyp-id hdp01

ssh-coyp-id hdp02

ssh-coyp-id hdp03

ssh-coyp-id hdp04

ssh-coyp-id hdp05

ssh-coyp-id hdp06

ssh-coyp-id hdp07

#配置hdp02到hdp03、hdp04、hdp05、hdp06、hdp07的免密碼登陸

#在hdp02上生產一對鑰匙

ssh-keygen -t rsa

#將公鑰拷貝到其他節點

ssh-coyp-id hdp03

ssh-coyp-id hdp04

ssh-coyp-id hdp05

ssh-coyp-id hdp06

ssh-coyp-id hdp07

#注意：兩個namenode之間要配置ssh免密碼登陸，別忘了配置hdp01到hdp02的免登陸

在hdp01上生產一對鑰匙

ssh-keygen -t rsa

ssh-coyp-id -i hdp01

將配置好的hadoop拷貝到其他節點：

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp02:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp03:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp04:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp05: /home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp06:/home/hadoop/apps

scp -r /home/hadoop/apps/hadoop-2.8.1/ hadoop@hdp07:/home/hadoop/apps

3.啟動服務

注意：嚴格按照下面的步驟

A. 啟動zookeeper集群（分別在hdp05、hdp06、hdp07上啟動zk）

zkServer.sh start

#查看狀態：一個leader，兩個follower

zkServer.sh status

B. 啟動journalnode（分別在在hdp05、hdp06、hdp07上執行）

hadoop-daemon.sh start journalnode

#運行jps命令檢驗，hdp05、hdp06、hdp07上多了JournalNode進程

C. 格式化HDFS

#在hdp01上執行命令:

hdfs namenode -format

#格式化后會在根據core-site.xml中的hadoop.tmp.dir配置生成個文件，這里我配置的是/home/hadoop/apps/hdpdata/，然后將/home/hadoop/apps/hdpdata/拷貝到hdp02的/home/hadoop/apps/下。

scp -r /home/hadoop/apps/hdpdata hadoop@#hdp02:/home/hadoop/apps/

D. 格式化ZKFC(在hdp01上執行一次即可)

hdfs zkfc -formatZK

E. 啟動HDFS(在hdp01上執行)

start-dfs.sh

F. 啟動YARN

注意：是在hdp03上執行start-yarn.sh，把namenode和resourcemanager分開是因為性能問題，因為他們都要占用大量資源，所以把他們分開了，他們分開了就要分別在不同的機器上啟動

start-yarn.sh

到此，hadoop-2.8.1配置完畢，可以統計瀏覽器訪問:

http://hdp01:50070

NameNode 'hadoop01:9000' (active)

http://hdp02:50070

NameNode 'hadoop02:9000' (standby)

驗證HDFS HA：

首先向hdfs上傳一個文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然后再kill掉active的NameNode

kill -9 <pid of NN>

通過瀏覽器訪問：http://hdp02:50070

NameNode 'hdp02:9000' (active)

這個時候hdp02上的NameNode變成了active

在執行命令：

hdp fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛才上傳的文件依然存在?。?！

手動啟動那個掛掉的NameNode

hdp-daemon.sh start namenode

通過瀏覽器訪問：http:// hdp01:50070

NameNode 'hdp01:9000' (standby)

????

驗證YARN：

運行一下hdp提供的demo中的WordCount程序：

hadoop jar share/hdp/mapreduce/hdp-mapreduce-examples-2.4.1.jar wordcount /profile /out

OK，大功告成?。?！

4. 測試集群工作狀態的一些指令：

hdfs dfsadmin -report 查看hdfs的各節點狀態信息

hdfs haadmin -getServiceState nn1 獲取一個namenode節點的HA狀態

hadoop-daemon.sh start namenode 單獨啟動一個namenode進程

hadoop-daemon.sh start zkfc 單獨啟動一個zkfc進程

QQ空間新浪微博騰訊微博人人網微信更多

上一篇： {思科CCIE-RS}BGP路由反射器及實驗 BY亂雪紛飛

下一篇： {Java}-Redis安裝

十五年老品牌

微信咨詢：togogoi 咨詢電話：18922156670 咨詢網站客服：在線客服

相關課程推薦

自慰套教室～女子全员妊娠,精品无码国产自产拍在线观看蜜桃,亚洲国产精品成人精品无码区,久别的草原在线看视频免费

網絡技術

系統運維

數據庫

云計算

安全

大數據

人工智能

項目管理

軟件開發

其他

優選課程

高校合作

企業定制

考試中心

學習資源

關于我們

學習文章

{hadoop-ha}集群搭建

關于我們

聯系我們

最新文章

客服熱線

全國校區

關注我們