博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop伪集群模式搭建
阅读量:4080 次
发布时间:2019-05-25

本文共 2009 字,大约阅读时间需要 6 分钟。

翻译自官方文档一节

Download

wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz

解压

tar -zxvf hadoop-2.9.2.tar.gz

配置PATH

vim /etc/profile

添加:

HADOOP_HOME=/usr/local/hadoop-2.9.2export PATH=$HADOOP_HOME/bin:${CLASSPATH}:$PATH

source /etc/profile

Hadoop伪集群搭建

hadoop可以以一个伪集群模式在单机上运行,每个hadoop daemon以一个单独的java线程运行。

配置

vim ${HADOOP_HOME}/etc/hadoop/core-site.xml

添加配置如下:

fs.defaultFS
hdfs://localhost:9000

vim ${HADOOP_HOME}/etc/hadoop/hdfs-site.xml

添加配置如下:

dfs.replication
1

hadoop脚本设置java home

vim ${HADOOP_HOME}/etc/hadoop/hadoop-env.sh
找到

export JAVA_HOME=${JAVA_HOME}

改成

export JAVA_HOME=具体路径

设置SSH免密登录

先检查本地是否可以使用免密登录

ssh localhost
如果没有设置,按照下面的操作设置:

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsacat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keyschmod 0600 ~/.ssh/authorized_keys

运行

1.格式化hdfs

hdfs namenode -format

2.启动namenode和datanode节点

cd ${HADOOP_HOME}/sbin/
./start-dfs.sh

hadoop节点的日志会写入到 H A D O O P L O G D I R 目 录 , 默 认 是 在 HADOOP_LOG_DIR目录,默认是在 HADOOPLOGDIR{HADOOP_HOME}/logs目录下

3.查看namenode的管理网页

默认地址是:

http://localhost:50070/

测试集群

运行hadoop自带的一个example来检测集群搭建是否正常

/hdfs dfs -mkdir /user/hdfs dfs -mkdir /user/
hdfs dfs -put etc/hadoop inputhadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar grep input output 'dfs[a-z.]+'bin/hdfs dfs -get output outputcat output/*

伪集群模式运行Yarn

添加一些配置文件,就可以在伪集群模式下再Yarn中运行map reduce任务。另外也可以把ResourceManager 和NodeManager节点跑起来。

配置

vim ${HADOOP_HOME}/etc/hadoop/mapred-site.xml

添加:

mapreduce.framework.name
yarn

vim ${HADOOP_HOME}/etc/hadoop/yarn-site.xml

添加:

yarn.nodemanager.aux-services
mapreduce_shuffle

启动ResourceManager和NodeManager

./${HADOOP_HOME}/sbin/start-yarn.sh

打开启动ResourceManager的web管理界面

默认:http://localhost:8088/

至此,集群搭建完成。

转载地址:http://ltsni.baihongyu.com/

你可能感兴趣的文章
139. Word Break (DP)
查看>>
Tensorflow入门资料
查看>>
剑指_用两个栈实现队列
查看>>
剑指_顺时针打印矩阵
查看>>
剑指_栈的压入弹出序列
查看>>
剑指_复杂链表的复制
查看>>
服务器普通用户(非管理员账户)在自己目录下安装TensorFlow
查看>>
星环后台研发实习面经
查看>>
大数相乘不能用自带大数类型
查看>>
字节跳动后端开发一面
查看>>
CentOS Tensorflow 基础环境配置
查看>>
centOS7安装FTP
查看>>
FTP的命令
查看>>
CentOS操作系统下安装yum的方法
查看>>
ping 报name or service not known
查看>>
FTP 常见问题
查看>>
zookeeper单机集群安装
查看>>
do_generic_file_read()函数
查看>>
Python学习笔记之数据类型
查看>>
Python学习笔记之特点
查看>>