当前位置：移动技术网 > 网络运营>服务器>Linux > linux环境不使用hadoop安装单机版spark的方法

linux环境不使用hadoop安装单机版spark的方法

2019年07月18日 | 移动技术网网络运营 | 我要评论

大数据持续升温，不熟悉几个大数据组件，连装逼的口头禅都没有。最起码，你要会说个hadoop, hdfs, mapreduce, yarn, kafka, spark, zookeeper, neo4j吧，这些都是装逼的必备技能。

关于spark的详细介绍, 网上一大堆，搜搜便是，下面，我们来说单机版的spark的安装和简要使用。

0. 安装jdk, 由于我的机器上之前已经有了jdk, 所以这一步我可以省掉。 jdk已经是很俗气的老生常谈了, 不多说, 用java/scala的时候可少不了。

ubuntu@vm-0-15-ubuntu:~$ java -version
openjdk version "1.8.0_151"
openjdk runtime environment (build 1.8.0_151-8u151-b12-0ubuntu0.16.04.2-b12)
openjdk 64-bit server vm (build 25.151-b12, mixed mode)
ubuntu@vm-0-15-ubuntu:~$

1. 你并不一定需要安装hadoop, 只需要选择特定的spark版本即可。你并不需要下载scala, 因为spark会默认带上scala shell. 去spark官网下载，在没有hadoop的环境下，可以选择：spark-2.2.1-bin-hadoop2.7，然后解压，如下：

ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc$ ll
total 196436
drwxrwxr-x 3 ubuntu ubuntu   4096 feb 2 19:57 ./
drwxrwxr-x 9 ubuntu ubuntu   4096 feb 2 19:54 ../
drwxrwxr-x 13 ubuntu ubuntu   4096 feb 2 19:58 spark-2.2.1-bin-hadoop2.7/
-rw-r--r-- 1 ubuntu ubuntu 200934340 feb 2 19:53 spark-2.2.1-bin-hadoop2.7.tgz

2. spark中有python和scala版本的, 下面，我来用scala版本的shell, 如下：

ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ bin/spark-shell 
using spark's default log4j profile: org/apache/spark/log4j-defaults.properties
setting default log level to "warn".
to adjust logging level use sc.setloglevel(newlevel). for sparkr, use setloglevel(newlevel).
18/02/02 20:12:16 warn nativecodeloader: unable to load native-hadoop library for your platform... using builtin-java classes where applicable
18/02/02 20:12:16 warn utils: your hostname, localhost resolves to a loopback address: 127.0.0.1; using 172.17.0.15 instead (on interface eth0)
18/02/02 20:12:16 warn utils: set spark_local_ip if you need to bind to another address
spark context web ui available at http://172.17.0.15:4040
spark context available as 'sc' (master = local[*], app id = local-1517573538209).
spark session available as 'spark'.
welcome to
   ____       __
   / __/__ ___ _____/ /__
  _\ \/ _ \/ _ `/ __/ '_/
  /___/ .__/\_,_/_/ /_/\_\  version 2.2.1
   /_/
using scala version 2.11.8 (openjdk 64-bit server vm, java 1.8.0_151)
type in expressions to have them evaluated.
type :help for more information.
scala>

来进行简单操作：

scala> val lines = sc.textfile("readme.md")
lines: org.apache.spark.rdd.rdd[string] = readme.md mappartitionsrdd[1] at textfile at <console>:24
scala> lines.count()
res0: long = 103
scala> lines.first()
res1: string = # apache spark
scala> :quit
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ 
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ 
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$  
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ wc -l readme.md 
103 readme.md
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ head -n 1 readme.md 
# apache spark
ubuntu@vm-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$

来看看可视化的web页面，在windows上输入：

ok, 本文仅仅是简单的安装，后面我们会继续深入介绍spark.

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对移动技术网的支持。如果你想了解更多相关内容请查看下面相关链接

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

proteus仿真stm32控制呼吸灯

proteus仿真stm32控制呼吸灯设计思路：采用stm32f103r6为主控芯片，及led-green；时钟... [阅读全文]
DSP28335的SPWM波生成方法

DSP新手，研究了一下午，在这里做个总结，希望对其他刚接触DSP的新手也能有所帮助。首先要明白SPWM波是什么。... [阅读全文]
【嵌入式】交叉编译移植 i2cTool4.1 史上最详细

一、i2ctool 介绍i2c-tools工具是一个专门调试i2c的，开源，可获取挂载的设备及设备地址，还可以在... [阅读全文]
荐 23-TensorFlow2.2+Keras版本新特性---自动图

基于autograph的tf.keras流程tensorflow-gpu安装查看版本tf.keras简单编程流程... [阅读全文]
ZYNQ 双核运行并交互，一个linux，一个裸核

zynq 7000 一般有2个cpu （arm A9)，我们一般都用一个cpu0，本实验让2个cpu 都运行起来... [阅读全文]
荐 Flutter：最难搞的搭建环境，一次性成功！（新手踩坑）

进入我的主页，查看更多Flutter的分享！我的电脑是Win10系统（专业版最新版本）；如果你是Linux系统... [阅读全文]
ZABBIX自定义监控指定的LINUX磁盘分区,并配置触发器产生告警

在ZABBIX客户端机器当中,有一台是挂载了WINDOWS分区的,设置该分区空闲的空间小于15%的时候触发告警服... [阅读全文]
Android7以上读写/data/data下其他APP私有文件的注意点

这里写自定义目录标题问题来源主要问题最终解决办法问题来源主要是因为从Android7以上，安卓的权限开始变得很严... [阅读全文]
云计算服务模式及应用

一、服务模式云计算的服务模式分为三类：IaaS(Infrastructure as a Service,基础设施... [阅读全文]
荐 MnasNet：经典轻量级神经网络搜索方法 | CVPR 2019

论文提出了移动端的神经网络架构搜索方法，该方法主要有两个思路，首先使用多目标优化方法将模型在实际设备上的耗时融入... [阅读全文]

网友评论


验证码：

linux环境不使用hadoop安装单机版spark的方法

2019年07月18日 | 移动技术网网络运营 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论