Hadoop / Yarn（v0.23.3）Psuedo-Distributed Mode设置::无作业节点-Java 学习之路

我只是在Psuedo-Distributed模式下设置Hadoop / Yarn 2.x（特别是v0.23.3） .

我按照一些博客和网站的说明进行操作，这些博客和网站或多或少提供相同的处方设置 . 我也遵循了O'reilly的第3版Hadoop书（具有讽刺意味的是最没用的） .

问题：

After running "start-dfs.sh" and then "start-yarn.sh", while all of the daemons
do start (as indicated by jps(1)), the Resource Manager web portal
(Here: http://localhost:8088/cluster/nodes) indicates 0 (zero) job-nodes in the
cluster. So while submitting the example/test Hadoop job indeed does get
scheduled, it pends forever because, I assume, the configuration doesn't see a
node to run it on.

Below are the steps I performed, including resultant configuration files.
Hopefully the community help me out... (And thank you in advance).

配置：

在my和hadoop的UNIX帐户配置文件中设置了以下环境变量：〜/ .profile：

export HADOOP_HOME=/home/myself/APPS.d/APACHE_HADOOP.d/latest
  # Note: /home/myself/APPS.d/APACHE_HADOOP.d/latest -> hadoop-0.23.3

export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_INSTALL=${HADOOP_HOME}
export HADOOP_CLASSPATH=${HADOOP_HOME}/lib
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop/conf
export HADOOP_MAPRED_HOME=${HADOOP_HOME}
export YARN_HOME=${HADOOP_HOME}
export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop/conf
export JAVA_HOME=/usr/lib/jvm/jre

hadoop $ java -version

java version "1.7.0_06-icedtea<br>
OpenJDK Runtime Environment (fedora-2.3.1.fc17.2-x86_64)<br>
OpenJDK 64-Bit Server VM (build 23.2-b09, mixed mode)<br>

# Although the above shows OpenJDK, the same problem happens with Sun's JRE/JDK.

NAMENODE和DATANODE目录，也在etc / hadoop / conf / hdfs-site.xml中指定：

/home/myself/APPS.d/APACHE_HADOOP.d/latest/YARN_DATA.d/HDFS.d/DATANODE.d/
/home/myself/APPS.d/APACHE_HADOOP.d/latest/YARN_DATA.d/HDFS.d/NAMENODE.d/

接下来，各种XML配置文件（此处为YARN / MRv2 / v0.23.3）：

hadoop$ pwd; ls -l
/home/myself/APPS.d/APACHE_HADOOP.d/latest/etc/hadoop/conf
lrwxrwxrwx 1 hadoop hadoop   16 Sep 20 13:14 core-site.xml -> ../core-site.xml
lrwxrwxrwx 1 hadoop hadoop   16 Sep 20 13:14 hdfs-site.xml -> ../hdfs-site.xml
lrwxrwxrwx 1 hadoop hadoop   18 Sep 20 13:14 httpfs-site.xml -> ../httpfs-site.xml
lrwxrwxrwx 1 hadoop hadoop   18 Sep 20 13:14 mapred-site.xml -> ../mapred-site.xml
-rw-rw-r-- 1 hadoop hadoop   10 Sep 20 15:36 slaves
lrwxrwxrwx 1 hadoop hadoop   16 Sep 20 13:14 yarn-site.xml -> ../yarn-site.xml

核心的site.xml

<?xml version="1.0"?>
<!-- core-site.xml -->
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost/</value>
  </property>
</configuration>

mapred-site.xml中

<?xml version="1.0"?>
<!-- mapred-site.xml -->
<configuration>

  <!-- Same problem whether this (legacy) stanza is included or not.  -->
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:8021</value>
  </property>

  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

HDFS-site.xml中

<!-- hdfs-site.xml -->
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/home/myself/APPS.d/APACHE_HADOOP.d/YARN_DATA.d/HDFS.d/NAMENODE.d</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/home/myself/APPS.d/APACHE_HADOOP.d/YARN_DATA.d/HDFS.d/DATANODE.d</value>
  </property>
</configuration>

纱的site.xml

<?xml version="1.0"?>
<!-- yarn-site.xml -->
<configuration>
  <property>
    <name>yarn.resourcemanager.address</name>
    <value>localhost:8032</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce.shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>4096</value>
  </property>
  <property>
    <name>yarn.nodemanager.local-dirs</name>
    <value>/home/myself/APPS.d/APACHE_HADOOP.d/YARN_DATA.d/TEMP.d</value>
  </property>
</configuration>

等/ Hadoop的/ conf目录/保存

localhost
   # Community/friends, is this entry correct/needed for my psuedo-dist mode?

杂项总结说明：

(1) As you may have gleaned from above, all files/directories are owned
    by the 'hadoop' UNIX user. There is a hadoop:hadoop, UNIX User and
    Group, respectively.

(2) The following command was run after the NAMENODE & DATANODE directories
    (listed above) were created (and whose paths were entered into
    hdfs-site.xml):

    hadoop$ hadoop namenode -format

(3) Next, I ran "start-dfs.sh", then "start-yarn.sh".
    Here is jps(1) output:

hadoop@e6510$ jps
    21979 DataNode
    22253 ResourceManager
    22384 NodeManager
    22156 SecondaryNameNode
    21829 NameNode
    22742 Jps

谢谢！

2 回答

0
经过多次努力解决这个问题没有成功（并相信我，我尝试了所有），我使用不同的解决方案制定了hadoop . 以上我从其中一个下载镜像下载了hadoop发行版的gzip / tar球（同样是v0.23.3），这次我使用了我们通过YUM repos安装的RPM包的Caldera CDH发行版 . 希望这对某人有所帮助，这里有详细的步骤 .

步骤1：

对于Hadoop 0.20.x（MapReduce版本1）：
```
# rpm -Uvh http://archive.cloudera.com/redhat/6/x86_64/cdh/cdh3-repository-1.0-1.noarch.rpm
  # rpm --import http://archive.cloudera.com/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
  # yum install hadoop-0.20-conf-pseudo
```
-要么-

对于Hadoop 0.23.x（MapReduce版本2）：
```
# rpm -Uvh http://archive.cloudera.com/cdh4/one-click-install/redhat/6/x86_64/cloudera-cdh-4-0.noarch.rpm
  # rpm --import http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
  # yum install hadoop-conf-pseudo
```
在上述两种情况下，安装“psuedo”软件包（代表“伪分布式Hadoop”模式）将单独方便地触发安装您需要的所有其他必要软件包（通过依赖项解析） .

第2步：

安装Sun / Oracle的Java JRE（如果您还没有这样做） . 您可以通过它们提供的RPM或gzip / tar ball便携版安装它 . 只要您适当地设置和导出“JAVA_HOME”环境并确保$ / bin / java在您的路径中，这并不重要 .
```
# echo $JAVA_HOME; which java
  /home/myself/APPS.d/JAVA-JRE.d/jdk1.7.0_07
  /home/myself/APPS.d/JAVA-JRE.d/jdk1.7.0_07/bin/java
```
注意：我实际创建了一个名为“latest”的符号链接，并在每次更新JAVA时将其指向/重新指向JAVA版本特定目录 . 我在上面明确了解读者的理解 .

步骤3：将hdfs格式化为“hdfs”Unix用户（在上面的“yum install”期间创建） .
```
# sudo su hdfs -c "hadoop namenode -format"
```
第4步：

手动启动hadoop守护进程 .
```
for file in `ls /etc/init.d/hadoop*`
  do
  {
     ${file} start
  }
  done
```
第五步：

检查一切是否正常 . 以下是MapReduce v1（在这个表面层面上，MapReduce v2并没有那么大的不同） .
```
root# jps
   23104 DataNode
   23469 TaskTracker
   23361 SecondaryNameNode
   23187 JobTracker
   23267 NameNode
   24754 Jps

   # Do the next commands as yourself (not as "root").
   myself$ hadoop fs -mkdir /foo
   myself$ hadoop fs -rmr /foo
   myself$ hadoop jar /usr/lib/hadoop-0.20/hadoop-0.20.2-cdh3u5-examples.jar pi 2 100000
```
我希望这有帮助！
回复于 2024-04-28T16:15:38+08:00
0

诺埃尔

我前几天跟着本教程中的步骤http://www.thecloudavenue.com/search?q=0.23，我设法 Build 了一个由3台6.3机器组成的小型集群

回复于 2024-04-28T16:15:38+08:00

Hadoop / Yarn（v0.23.3）Psuedo-Distributed Mode设置::无作业节点

2 回答

相关问题