服務(wù)近2000家企業(yè),依托一系列實踐中打磨過的技術(shù)和產(chǎn)品,根據(jù)企業(yè)的具體業(yè)務(wù)問題和需求,針對性的提供各行業(yè)大數(shù)據(jù)解決方案。
hadoop2.7.3在centos7上部署安裝(單機版)
來源:未知 時間:2018-28-17 瀏覽次數(shù):342次
hadoop單機版運行環(huán)境搭建,相對于分布式版本而言單機版相對簡單,適合于初學(xué)者學(xué)習使用
(1)hadoop2.7.3下載
(1)hadoop2.7.3下載
(前提:先安裝java環(huán)境)
下載地址:http://hadoop.apache.org/releases.html

(注意是binary文件,source那個是源碼)
(2)解壓tar.gz

(3)配置hadoop
1.修改/usr/hadoop/hadoop-2.7.3/etc/hadoop/hadoop-env.sh 文件的java環(huán)境,將java安裝路徑加進去:
- export JAVA_HOME=/alidata/server/java-1.7.0
export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_HOME}/lib/native
export HADOOP_OPTS="-Djava.library.path=${HADOOP_HOME}/lib/native"
注意,不加此配置會導(dǎo)致部分hadoop命令運行時找不到native lib
#export HADOOP_ROOT_LOGGER=DEBUG,console //查看hadoop日志,一般報錯上語句為報錯原因,需要調(diào)試時開啟
配置hadoop環(huán)境變量
vi /etc/profile
- export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
- export PATH=$PATH:$HADOOP_HOME/bin
有的安裝介紹中說是vi ~/.bash_profile,其實也可以用這個,2個命令在不同系統(tǒng)用戶的環(huán)境配置的作用域不一樣。參考:
http://blog.csdn.net/caiwenfeng_for_23/article/details/44242961
使之生效:
- source /etc/profile
2.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/core-site.xml 文件,
- <configuration>
- <!-- 指定HDFS老大(namenode)的通信地址 -->
- <property>
- <name>fs.defaultFS</name>
- <value>hdfs://localhost:9000</value>
- </property>
- <!-- 指定hadoop運行時產(chǎn)生文件的存儲路徑 -->
- <property>
- <name>hadoop.tmp.dir</name>
- <value>/usr/hadoop/tmp</value>
- </property>
- </configuration>
fs.defaultFS直接用localhost就行,如果重命名了主機名,也可以用重命名的。
3.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/hdfs-site.xml
- <configuration>
- <property>
- <name>dfs.name.dir</name>
- <value>/usr/hadoop/hdfs/name</value>
- <description>namenode上存儲hdfs名字空間元數(shù)據(jù) </description>
- </property>
- <property>
- <name>dfs.data.dir</name>
- <value>/usr/hadoop/hdfs/data</value>
- <description>datanode上數(shù)據(jù)塊的物理存儲位置</description>
- </property>
- <!-- 設(shè)置hdfs副本數(shù)量 -->
- <property>
- <name>dfs.replication</name>
- <value>1</value>
- </property>
- </configuration>
4.SSH免密碼登錄
- ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
- cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
- chmod 0600 ~/.ssh/authorized_keys
5.hdfs啟動與停止
第一次啟動hdfs需要格式化,之后啟動就不需要的:
- cd /usr/hadoop/hadoop-2.7.3
- ./bin/hdfs namenode -format
啟動命令:
./sbin/start-dfs.sh
停止命令:
- ./sbin/stop-dfs.sh
從圖中看,會啟動namenode,datanode,secondarynamenode
瀏覽器輸入:http://119.29.174.43:50070 查看效果:

6.接下來配置yarn文件. 配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/mapred-site.xml 。這里注意一下,hadoop里面默認是mapred-site.xml.template 文件,如果配置yarn,把mapred-site.xml.template 重命名為mapred-site.xml 。如果不啟動yarn,把重命名還原。
- mv mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
- <configuration>
- <!-- 通知框架MR使用YARN -->
- <property>
- <name>mapreduce.framework.name</name>
- <value>yarn</value>
- </property>
- </configuration>
7.配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/yarn-site.xml文件,
- <configuration>
- <!-- reducer取數(shù)據(jù)的方式是mapreduce_shuffle -->
- <property>
- <name>yarn.nodemanager.aux-services</name>
- <value>mapreduce_shuffle</value>
- </property>
- </configuration>
8.啟動yarn
啟動:
- ./sbin/start-yarn.sh
停止:
./sbin/stop-yarn.sh
如圖:

會啟動resourcemanager,nodemanager
可以用jps命令查看啟動了什么進程:
瀏覽器輸入:http://119.29.174.43:8088 (8088是默認端口,如果端口占用,先把占用的端口殺掉 netstat -ano)