当前位置：移动技术网 > IT编程>开发语言>Java > Hadoop1.2中配置伪分布式的实例

Hadoop1.2中配置伪分布式的实例

2019年07月22日 | 移动技术网IT编程 | 我要评论

1、设置ssh

安装ssh相关软件包：

sudo apt-get install openssh-client openssh-server

然后使用下面两个命令之一启动/关闭sshd：

sudo /etc/init.d/ssh start|stop
sudo service ssh start|stop

若成功启动sshd，我们能看到如下类似结果：

复制代码代码如下:

$ ps -e | grep ssh
 2766 ?        00:00:00 ssh-agent
10558 ?        00:00:00 sshd

这时候，如果运行如下ssh登录本机的命令，会提示输入密码：

复制代码代码如下:

ssh localhost

现在我们要做的就是让它不需要输入密码：

复制代码代码如下:

$ ssh-keygen -t rsa -p '' -f ~/.ssh/id_rsa  #一个空密码的ssh密钥
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

这样的话就行了。如果仍不凑效，可能是密钥文件的权限设置不当。

2、配置hadoop

将hadoop-1.2.1解压到~/下，同时在~/下建立目录hadoop-env，继续在hadoop-env下建立如下的目录结构：

├── dfs
│   ├── checkpoint1
│   ├── data1
│   ├── data2
│   └── name1
└── test
    └── input
配置文件hadoop-1.2.1/conf/core-site.xml：

复制代码代码如下:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- put site-specific property overrides in this file. -->
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
    <final>true</final>
  </property>
</configuration>

fs.default.name来指定hdfs的uri，如果value中没有提供端口，默认为8020。

配置文件hadoop-1.2.1/conf/hdfs-site.xml：

复制代码代码如下:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- put site-specific property overrides in this file. -->
<configuration>
  <property>
    <name>dfs.name.dir</name>
    <value>~/hadoop-env/dfs/name1</value>
    <final>true</final>
  </property>
  <property>
    <name>dfs.data.dir</name>
    <value>~/hadoop-env/dfs/data1,~/hadoop-env/dfs/data2</value>
    <final>true</final>
  </property>
  <property>
    <name>fs.checkpoint.dir</name>
    <value>~/hadoop-env/dfs/checkpoint1</value>
    <final>true</final>
  </property>
</configuration>

dfs.name.dir指定namenode存储元数据的目录，可以指定多个目录，这些目录要用逗号分开；dfs.data.dir指定datanode存放数据的目录，可以指定多个目录；fs.checkpoint.dir指定辅助namenode存放检查点的目录。

配置文件hadoop-1.2.1/conf/mapred-site.xml：

复制代码代码如下:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- put site-specific property overrides in this file. -->
<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
    <final>true</final>
  </property>
</configuration>

3、测试

先格式化hdfs：

复制代码代码如下:

./hadoop-1.2.1/bin/hadoop namenode -format

启动hdfs和mapreduce进程：

复制代码代码如下:

$ ./hadoop-1.2.1/bin/start-dfs.sh
$ ./hadoop-1.2.1/bin/start-mapred.sh

启动时候如果报错，例如localhost: error: java_home is not set.，需要在./hadoop-1.2.1/conf/hadoop-env.sh文件中export java_home，例如：

export java_home=~/jdk1.7.0_25
如何检查是否成功启动了：第一种方法是使用jps命令（java virtual machine process status tool），应该有如下类似输出：

复制代码代码如下:

$ jps
datanode
secondarynamenode
jobtracker
namenode
tasktracker
jps

第二种方法是浏览器登录http://localhost:50030查看jobtracker，http://localhost:50070查看namenode。如果在使用翻墙软件，那么在访问时可能会报错，最简单的解决方法是关掉翻墙软件。还有一种方法就是查看日志文件。

现在我们在~/hadoop-env/test/input目录下建立两个文件：

复制代码代码如下:

$ echo "hello world" > test1.txt 
$ echo "hi,world" > test2.txt

把这两个文件导入hdfs：

复制代码代码如下:

./hadoop-1.2.1/bin/hadoop dfs -put hadoop-env/test/input/ output/

查看：

复制代码代码如下:

$ ./hadoop-1.2.1/bin/hadoop dfs -ls /
found 2 items
drwxr-xr-x - user supergroup 0 2013-10-22 22:07 /test
drwxr-xr-x - user supergroup 0 2013-10-22 21:58 /tmp

$ ./hadoop-1.2.1/bin/hadoop dfs -ls /test
found 2 items
-rw-r--r-- 3 user supergroup 12 2013-10-22 22:07 /test/test1.txt
-rw-r--r-- 3 user supergroup 9 2013-10-22 22:07 /test/test2.txt

ok，配置完成。

注：本文使用的系统是linux mint 15 64bit，hadoop使用的是1.2.1版本。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

springmvc之ResponseBody响应json数据遇到的错误及解决

使用@RequestBody注解把json的字符串转换成JavaBean的对象代码实践过程中遇到错误：[http... [阅读全文]
nuxt模板的创建及使用（koa、sass）

概念Nuxt.js 是一个基于 Vue.js 的服务端渲染应用框架。Nuxt.js 为客户端/服务端这种典型... [阅读全文]
今天学习了transform的几种变换属性

transform变换transform: translate(x,y);1、2D移动是2D转换里面的一个功能，... [阅读全文]
Docker部署Gitlab，ssh端口不用22的解决方法

虚拟机中的端口：22被占用了，所以Gitlab的端口：22需要重新映射解决办法：web: image: 'gi... [阅读全文]
uni-app 后台升级静默升级 uniapp 后台更新静默更新在线升级

uni-app开发到一段落了，最后的app更新好好搞一下，完美的收尾，哈哈哈在uni-app的文档中可以看到内置... [阅读全文]
VSCode使用码云(Gitee)简易教程

配置Git配置SSH公钥安装完Git以后，打开Git Bash。执行如下命令生成ssh公钥：ssh-keygen... [阅读全文]
JavaWeb 之Servlet 规律强化(三)

一.Servlet规律强化1.WEB项目Servlet服务器Java小程序。Jar包：2.... [阅读全文]
荐写好技术简历的一些建议

根据我求职与招聘的经验，结合网上相关资料，这里整理了一些写好技术简历的建议。这里提供了一份简历模版，可供参考。保... [阅读全文]
SpringBoot多Module启动报错Could not transfer metadata

原因：本地没找到项目依赖的jar去私服找解决办法：install本地项目 [阅读全文]
Hibernate项目报错：Cannot call sendError() after the response has been committed

问题描述：在之前的旧项目上开发一些新功能：其中一个功能是开发系统的操作日志，项目框架是：SSH，由于系统已经上... [阅读全文]

网友评论


验证码：

Hadoop1.2中配置伪分布式的实例

2019年07月22日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论