在 Linux 上安裝或設定
偽分散式群集設定過程
先決條件
- 
安裝 JDK1.7 並設定 JAVA_HOME 環境變數。 
- 
建立一個新使用者為 hadoop。useradd hadoop
- 
設定無密碼 SSH 登入到自己的帳戶 su - hadoop ssh-keygen << Press ENTER for all prompts >> cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 0600 ~/.ssh/authorized_keys
- 
通過執行 ssh localhost驗證
- 
通過編輯 /etc/sysctl.conf禁用 IPV6,具體如下:net.ipv6.conf.all.disable_ipv6 = 1 net.ipv6.conf.default.disable_ipv6 = 1 net.ipv6.conf.lo.disable_ipv6 = 1
- 
檢查使用 cat /proc/sys/net/ipv6/conf/all/disable_ipv6(應該返回 1) 
安裝配置:
- 
使用 wget命令從 Apache 歸檔檔案下載所需的 Hadoop 版本。cd /opt/hadoop/ wget http:/addresstoarchive/hadoop-2.x.x/xxxxx.gz tar -xvf hadoop-2.x.x.gz mv hadoop-2.x.x.gz hadoop (or) ln -s hadoop-2.x.x.gz hadoop chown -R hadoop:hadoop hadoop
- 
使用以下環境變數,根據你的 shell 更新 .bashrc/.kshrcexport HADOOP_PREFIX=/opt/hadoop/hadoop export HADOOP_CONF_DIR=$HADOOP_PREFIX/etc/hadoop export JAVA_HOME=/java/home/path export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin:$JAVA_HOME/bin
- 
在 $HADOOP_HOME/etc/hadoop目錄下編輯下面的檔案- 
核心的 site.xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:8020</value> </property> </configuration>
- 
mapred-site.xml 中 從模板建立 mapred-site.xmlcp mapred-site.xml.template mapred-site.xml<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
- 
紗的 site.xml <configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
- 
HDFS-site.xml 中 <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:///home/hadoop/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:///home/hadoop/hdfs/datanode</value> </property> </configuration>
 建立父資料夾以儲存 hadoop 資料 mkdir -p /home/hadoop/hdfs
- 
- 
格式化 NameNode(清理目錄並建立必要的元檔案) hdfs namenode -format
- 
開始所有服務: start-dfs.sh && start-yarn.sh mr-jobhistory-server.sh start historyserver
而是使用 start-all.sh(不建議使用)。
- 
檢查所有正在執行的 java 程序 jps
- 
Namenode Web 介面: http:// localhost:50070 / 
- 
資源管理器 Web 介面: http:// localhost:8088 / 
- 
要停止守護程序(服務): stop-dfs.sh && stop-yarn.sh mr-jobhistory-daemon.sh stop historyserver
而是使用 stop-all.sh(不建議使用)。