当前位置：移动技术网 > 科技>人工智能>云计算 > windows10+eclipse+hadoop2.5.0环境搭建

windows10+eclipse+hadoop2.5.0环境搭建

2017年12月28日 | 移动技术网科技 | 我要评论

一、Linux上配置Hadoop集群环境。

二、windows基础环境搭建

1.jdk环境配置

--》安装好jdk后配置相关JAVA_HOME环境变量配置jdk安装目录，path环境变量配置jdk的

bin目录，classpath环境变量配置 .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar;

2.下载 Hadoop-2.5.0.tar.gz

5.修改windows的hosts文件，配置主机名

--》192.168.1.101 Hadoop01 --》这是配置Linux的IP与主机名关联

三、eclipse环境配置

1.解压Hadoop- 2.5.0.tar.gz，将hadoop.dll,winutils.exe复制到Hadoop-2.5.0/bin目录下

2.将hadoop-eclipse-plugin-2.5.1.jar拷贝至eclipse的plugins目录下，重启eclipse

3.打开菜单栏Windows-Preferences-Hadoop Map/Reduce 配置windows上解压后的Hadoop-2.5.0.tar.gz目录

4.配置连接Hadoop信息：Windows-ShowView填写配置信息，如下图示

Host：hdfs的主机IP，这里Hadoop01，因为我们在windows的hosts文件中已经配置了主机名与IP绑定了

左边Port：hdfs的web访问端口，右边Port：hdfs内部访问端口

5.如果连接成功，则显示以下信息就是hdfs文件系统的所有文件信息

4.创建一个Java项目编写WordCount程序

package com.bigdata.mapreduce;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import com.bigdata.mapreduce.MapReduceModule.MapReduceMapper.MapReduceReducer;

public class MapReduceModule {

// step 1: Mapper Class

public static class MapReduceMapper extends Mapper {

private Text mapOutputKey = new Text();

// 出现一次就记录一次

private IntWritable mapOutputValue = new IntWritable(1);

@Override

public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

// 读取文件的每一行，将Text类型转换成String类型

String lineValue = value.toString();

// 分割单词，以空格分割

String[] strs = lineValue.split(" ");

// 分割之后将单词从数组中一个个拿出来，组成，比如

for (String str : strs) {

// 设置key输出

mapOutputKey.set(str);

// map输出

context.write(mapOutputKey, mapOutputValue);

}

// step2: Reducer Class

public static class MapReduceReducer extends Reducer {

private IntWritable outputValue = new IntWritable();

@Override

protected void reduce(Text key, Iterable values, Context context)

throws IOException, InterruptedException {

// temp: sum

int sum = 0;

// 对值进行跌代累加

for (IntWritable value : values) {

// total

sum += value.get();

}

// set output value

outputValue.set(sum);

// 最终输出

context.write(key, outputValue);

}

// step3: Driver

public int run(String[] args) throws Exception {

// 获取集群中的相关配置信息

Configuration configuration = new Configuration();

// 创建一个Job任务

Job job = Job.getInstance(configuration, this.getClass().getSimpleName());

// 整个MapReduce程序运行的入口，或者叫jar包的入口，jar具体运行的是哪个类

job.setJarByClass(this.getClass());

// 设置Job

// input输入，输入路径

Path inpath = new Path(args[0]);

FileInputFormat.addInputPath(job, inpath);

// outout输出，输出路径

Path outpath = new Path(args[1]);

FileOutputFormat.setOutputPath(job, outpath);

// 设置Mapper

job.setMapperClass(MapReduceMapper.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

// 设置Reducer

job.setReducerClass(MapReduceReducer.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

// 提交Job -》 YARN

boolean isSuccess = job.waitForCompletion(true);

return isSuccess ? 0 : 1;

}

public static void main(String[] args) throws Exception {

args = new String[] { "hdfs://bigdata-senior01.liuhongyang.com:8020/user/admin/mapreduce/input",

"hdfs://bigdata-senior01.liuhongyang.com:8020/user/admin/mapreduce/output3" };

// run job

int status = new MapReduceModule().run(args);

// 关闭

System.exit(status);

}

运行此类

如果产生Exception in thread "main" java.lang.UnsatisfiedLinkError:

org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)异常

则将Hadoop-common包中org.apache.hadoop.util.DiskChecker.class文件复制出来在项目中创建

org.apache.hadoop.util.DiskChecker.java文件，注释94行代码，checkDirAccess(dir)

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

云计算将带来商业模式革命概念股“千里挑一”

　　国金证券通信行业首席分析师陈运红：云计算将带来商业模式革命概念股“千里挑一” 　　江怡曼　　提到云计... [阅读全文]
虚拟化和云计算路向何方？

　　我们正处于一个有趣的历史节点。VMware公司的成功源于我们拥有的非常引人注目的价值主张——解决客户端-服务器时代的不... [阅读全文]
企业级虚拟化平台是云计算必由之路

　　6月20日，IBM新一代企业基础云平台研讨会在北京举行。IBM大中华区系统与科技部Power Systems高级产品经理谷建发表了主题演讲。谷... [阅读全文]
打造免费云平台十大与云有关开源项目

　　开源项目由于其开放、免费、自由灵活等特点深受广大开发者的喜爱。近年涌现了很多开源免费的东西深受欢迎。而云计算则是近段时间最热的科技名词，云计算... [阅读全文]
Oracle刘松：客户体验管理与社会化云服务平台

10月26日消息，由工信部信息化推进司指导，中国计算机用户协会与中国网上银行促进联盟主办的“2012年网银联盟大会暨电子银行创新颁奖典... [阅读全文]
胡斌：做大数据最终是要为公司带来变化的

10月24日“中国TMT国际商会月度英雄汇”在北京召开。胡斌在圆桌对话“大数据时代的机遇与挑战”中... [阅读全文]
确保云安全的五种服务器配置方法

　　越来越多的数据中心已经搬到了各种各样的云上，服务器配置是必须考虑的问题。　　云计算将是收缩数据中心的关键，显然这可能带来一些安全问题... [阅读全文]
跨入云计算时代传统服务器走将向何处？

　　云的出现，正在改变我们对于传统IT的观念认识。云并不像它的概念一样虚无缥缈，而是以各种形式出现在我们面前，而最让人耳熟能详的莫过于云存储和云计... [阅读全文]
解读透明计算：是云计算升级还是产业界革命

　　你知道云计算吗？不少读者可能会说，嗯，我听说过，但是具体是怎么定义还是不太了解。虽然概念上不是很明白，但起码云计算到现在已经是人尽皆知。不过就... [阅读全文]
十二大技巧保障云计算安全

　　1、确认现有的基础控制　　基础控制是企业安全理念的核心。它们包含了将近60个保护您企业最重要资产的安全控制。它们专注在确保云技术对您... [阅读全文]

网友评论


验证码：

windows10+eclipse+hadoop2.5.0环境搭建

2017年12月28日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论