当前位置：移动技术网 > 科技>人工智能>云计算 > Spark的体系结构和安装配置

Spark的体系结构和安装配置

2018年04月03日 | 移动技术网科技 | 我要评论

Spark体系结构

1、体系结构：Client-Server（主从模式） ----> 单点故障：HA（ZooKeeper）

这里写图片描述

安装和部署

准备工作：安装Linux、JDK、主机名、免密码登录
            standalone
            tar -zxvf spark-2.1.0-bin-hadoop2.7.tgz -C ~/training/
            注意：hadoop和spark命令脚本有冲突，只能设置一个
            核心配置文件：spark-env.sh

*）伪分布模式: bigdata11机器
              spark-env.sh
                    export JAVA_HOME=/root/training/jdk1.8.0_144
                    export SPARK_MASTER_HOST=bigdata11
                    export SPARK_MASTER_PORT=7077

              slave文件：
                    bigdata11

              启动：sbin/start-all.sh
              Web Console: http://ip:8080  (内置了一个tomcat)

（*）全分布模式: bigdata12  bigdata13  bigdata14
            (1)在主节点上进行安装
              spark-env.sh
                    export JAVA_HOME=/root/training/jdk1.8.0_144
                    export SPARK_MASTER_HOST=bigdata12
                    export SPARK_MASTER_PORT=7077

              slave文件：
                    bigdata13
                    bigdata14                   

            (2) 复制到从节点上
                    scp -r spark-2.1.0-bin-hadoop2.7/ root@bigdata13:/root/training
                    scp -r spark-2.1.0-bin-hadoop2.7/ root@bigdata14:/root/training

            (3) 在主节点上启动
              启动：sbin/start-all.sh
              Web Console: http://ip:8080  (内置了一个tomcat)

3、Spark的HA实现：两种方式
        （1）基于文件系统的单点故障恢复：只有一个主节点、只能用于开发测试
            （*）特点：把Spark的运行信息写入到一个本地的恢复目录
                       如果Master死掉了，恢复master的时候从恢复目录上读取之前的信息
                       需要人为重启

            （*）Spark的运行信息
                Spark Application和Worker的注册信息

            （*）配置:
                 （a）创建目录：mkdir /root/training/spark-2.1.0-bin-hadoop2.7/recovery
                 （b）参数：
                        spark.deploy.recoveryMode：取值：默认NONE--> 没有开启HA
                                                         FILESYSTEM ---> 基于文件系统的单点故障恢复
                                                         ZOOKEEPER ---> 基于ZooKeeper实现Standby的Master
                        spark.deploy.recoveryDirectory: 恢复目录

                 （c）修改spark-env.sh
                       增加：export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/root/training/spark-2.1.0-bin-hadoop2.7/recovery"

            （*）测试:启动spark-shell
                    bin/spark-shell --master spark://bigdata12:7077

                    sbin/stop-master.sh
                    日志
                    scala> 18/02/09 00:40:42 WARN StandaloneAppClient$ClientEndpoint: Connection to bigdata12:7077 failed; waiting for master to reconnect...
                    18/02/09 00:40:42 WARN StandaloneSchedulerBackend: Disconnected from Spark cluster! Waiting for reconnection...
                    18/02/09 00:40:42 WARN StandaloneAppClient$ClientEndpoint: Connection to bigdata12:7077 failed; waiting for master to reconnect...

                    重新启动master

        （2）基于ZooKeeper实现Standby的Master
            （*）复习：相当于是一个“数据库”
                       角色：leader、follower
                       功能：选举、数据同步、分布式锁（秒杀功能）

            （*）原理
            （*）参数
                spark.deploy.recoveryMode   设置为ZOOKEEPER开启单点恢复功能，默认值：NONE
                spark.deploy.zookeeper.url  ZooKeeper集群的地址
                spark.deploy.zookeeper.dir  Spark信息在ZK中的保存目录，默认：/spark

            （*）修改spark-env.sh
                export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=bigdata12:2181,bigdata13:2181,bigdata14:2181 -Dspark.deploy.zookeeper.dir=/spark"
                另外，每个节点上，需要将以下两行注释掉
                #export SPARK_MASTER_HOST=spark82
                #export SPARK_MASTER_PORT=7077

            （*）测试
                  bigdata12: sbin/start-all.sh
                  bigdata13(14)：手动启动一个master
                                   sbin/start-master.sh

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

云计算将带来商业模式革命概念股“千里挑一”

　　国金证券通信行业首席分析师陈运红：云计算将带来商业模式革命概念股“千里挑一” 　　江怡曼　　提到云计... [阅读全文]
虚拟化和云计算路向何方？

　　我们正处于一个有趣的历史节点。VMware公司的成功源于我们拥有的非常引人注目的价值主张——解决客户端-服务器时代的不... [阅读全文]
企业级虚拟化平台是云计算必由之路

　　6月20日，IBM新一代企业基础云平台研讨会在北京举行。IBM大中华区系统与科技部Power Systems高级产品经理谷建发表了主题演讲。谷... [阅读全文]
打造免费云平台十大与云有关开源项目

　　开源项目由于其开放、免费、自由灵活等特点深受广大开发者的喜爱。近年涌现了很多开源免费的东西深受欢迎。而云计算则是近段时间最热的科技名词，云计算... [阅读全文]
Oracle刘松：客户体验管理与社会化云服务平台

10月26日消息，由工信部信息化推进司指导，中国计算机用户协会与中国网上银行促进联盟主办的“2012年网银联盟大会暨电子银行创新颁奖典... [阅读全文]
胡斌：做大数据最终是要为公司带来变化的

10月24日“中国TMT国际商会月度英雄汇”在北京召开。胡斌在圆桌对话“大数据时代的机遇与挑战”中... [阅读全文]
确保云安全的五种服务器配置方法

　　越来越多的数据中心已经搬到了各种各样的云上，服务器配置是必须考虑的问题。　　云计算将是收缩数据中心的关键，显然这可能带来一些安全问题... [阅读全文]
跨入云计算时代传统服务器走将向何处？

　　云的出现，正在改变我们对于传统IT的观念认识。云并不像它的概念一样虚无缥缈，而是以各种形式出现在我们面前，而最让人耳熟能详的莫过于云存储和云计... [阅读全文]
解读透明计算：是云计算升级还是产业界革命

　　你知道云计算吗？不少读者可能会说，嗯，我听说过，但是具体是怎么定义还是不太了解。虽然概念上不是很明白，但起码云计算到现在已经是人尽皆知。不过就... [阅读全文]
十二大技巧保障云计算安全

　　1、确认现有的基础控制　　基础控制是企业安全理念的核心。它们包含了将近60个保护您企业最重要资产的安全控制。它们专注在确保云技术对您... [阅读全文]

网友评论


验证码：

Spark的体系结构和安装配置

2018年04月03日 | 移动技术网科技 | 我要评论

Spark体系结构

安装和部署

您可能感兴趣的文章:

相关文章:

网友评论