当前位置：移动技术网 > 科技>操作系统>Linux > Hadoop分布环境搭建步骤,及自带MapReduce单词计数程序实现

Hadoop分布环境搭建步骤,及自带MapReduce单词计数程序实现

2019年01月08日 | 移动技术网科技 | 我要评论

breath of life,qq猎鹰乐园,重庆时时彩-三七三七九九qun

参考腾讯云实验室

hadoop分布环境搭建步骤：

1.软硬件环境

centos 7.2 64 位

jdk- 1.8

hadoo p- 2.7.4

2.安装ssh

sudo yum install openssh-clients openssh-server

测试: ssh localhost 测试完事 exit命令退出

3.安装java环境

sudo yum install java-1.8.0-openjdk java-1.8.0-openjdk-devel

配置：目录root/下面的bashrc文件结尾添加：export java_home=/usr/lib/jvm/java-1.8.0-openjdk

使用命令 source ~/.bashrc 使文件生效

测试：java -version

$java_home/bin/java -version

若两条命令输出的结果一致，且都为我们前面安装的 openjdk-1.8.0 的版本，则表明 jdk 环境已经正确安装并配置

4.安装hadoop：(1). 下载 hadoop :wget https://archive.apache.org/dist/hadoop/common/hadoop-2.7.4/hadoop-2.7.4.tar.gz

(2).将 hadoop 安装到 /usr/local 目录下: tar -zxf hadoop-2.7.4.tar.gz -c /usr/local

(3).重命名： cd /usr/local

mv ./hadoop-2.7.4/ ./hadoop

(4) 检查hadoop是否已经正确安装:/usr/local/hadoop/bin/hadoop version

5. hadoop 伪分布式环境配置:

(1).设置 hadoop 的环境变量 :在 root/ 目录下的 .bashrc，在结尾追加如下内容： export hadoop_home=/usr/local/hadoop

export hadoop_install=$hadoop_home

export hadoop_mapred_home=$hadoop_home

export hadoop_common_home=$hadoop_home

export hadoop_hdfs_home=$hadoop_home

export yarn_home=$hadoop_home

export hadoop_common_lib_native_dir=$hadoop_home/lib/native

export path=$path:$hadoop_home/sbin:$hadoop_home/bin

(2).使hadoop环境变量配置生效:source ~/.bashrc

(3).修改 hadoop 的配置文件hadoop的配置文件位于安装目录的 /etc/hadoop 目录下:

<name>hadoop.tmp.dir</name>

<value>file:/usr/local/hadoop/tmp</value>

<description>location to store temporary files</description>

</property>

<name>fs.defaultfs</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/data</value>

</property>

</configuration>

(4).格式化 namenode:/usr/local/hadoop/bin/hdfs namenode -format

(5).启动 namenode 和 datanode 进程:/usr/local/hadoop/sbin/start-dfs.sh

检查是否成功：jps

如果namenode和datanode已经正常启动，会显示namenode、datanode和secondarynamenode的进程信息:

[hadoop@vm_80_152_centos ~]$ jps

3689 secondarynamenode

3520 datanode

3800 jps

3393 namenode

6。调试：自带单词计数程序

hadoop实现自带的mapreduce单词计数：

第一步找到examples例子：

第二步在hdfs上面建立几个数据目录：

hadoop fs -mkdir -p /data/wordcount

hadoop fs -mkdir -p /output/

第三步建立文件存放数据：vi /usr/inputword

新建完成，查看内容：cat /usr/inputword

第四步：将本地文件上传到hdfs:hadoop fs -put /usr/inputword /data/wordcount/

查看上传文件情况：hadoop fs -ls /data/wordcount

第五步运行：hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar wordcount /data/wordcount /output/wordcount

第六步显示结果：hadoop fs -text /output/wordcount/part-r-00000 我导师

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

关于Nginx处理HTTP请求的11个阶段流程

nginx实际把http请求处理流程划分为了11个阶段，这样划分的原因是将请求的执行逻辑细分，以模块为单位进行处理，各个阶段可以包含任意多个http模块... [阅读全文]
应用系统分布式构建运维

应用系统分布式构建运维 1+x初级，项目四部署主从数据库基础环境安装准备两台主机修改主机名 # hostnamectl set-hos... [阅读全文]
自动化运维工具Ansible之Tests测验详解

Ansible Tests 详解与使用案例主机规划添加用户账号说明： 1、运维人员使用的登录账号； 2、所有的业务都放在 /app/ 下「yu... [阅读全文]
Linux环境变量

在bash shell中，环境变量分为两类：全局变量局部变量全局环境变量全局环境变量对于shell会话和所有生成的子shell都是可见的。例如 ... [阅读全文]
快速升级Zabbix 5.0 版本

Zabbix 5.0 增加了很多新功能，如：垂直菜单、隐藏菜单、用户界面中的测试项目、限制代理检查、查找并替换预处理步骤 ES7支持等等...快来部署体... [阅读全文]
企业级虚拟化实战之KVM——虚拟机迁移

迁移概述系统的迁移是指把源主机上的操作系统和应用程序移动到目的主机，并且能够在目的主机上正常运行在没有虚拟机的时代，物理机之间的迁移依靠的... [阅读全文]
初步进入Linux世界

初步进入Linux世界一、Linux目录介绍 1.树型目录结构 Linux文件系统采用了多级目录的树型层次结构管理文件。树型结构的最上层是根目录，用／... [阅读全文]
Linux常用命令（详细）

Linux常用命令一、控制台相关命令控制台命令就是指通过字符界面输入的可以操作系统的命令。我们现在要了解的是基于Linux操作系统的基本控制台命令。... [阅读全文]
更安全的rm命令，保护重要数据

更安全的rm命令，保护重要数据网上流传的安全的rm，几乎都是提供一个rm的"垃圾"回收站，在服务器环境上来说，这实非良方。我想，提供一个安全的rm去... [阅读全文]
Javaweb项目配置到阿里云服务器

前言：在网上找了很多的博客教程，最后终于成功，记录一下，方便日后的查找。 https://blog.csdn.net/M_Kerry/article/d... [阅读全文]

网友评论


验证码：

Hadoop分布环境搭建步骤,及自带MapReduce单词计数程序实现

2019年01月08日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论