当前位置：移动技术网 > IT编程>数据库>其他数据库 > Apache Flink 分布式运行时环境

Apache Flink 分布式运行时环境

2019年01月08日 | 移动技术网IT编程 | 我要评论

tasks and operator chains(任务及操作链)

在分布式环境下，flink将操作的子任务链在一起组成一个任务，每一个任务在一个线程中执行。将操作链在一起是一个不错的优化:它减少了线程间的切换和缓冲，提升了吞吐量同时减低了时延。这些链式行为是可配置的，详情请见:

下图中的示例以5个子任务来运行，因此有5个并发的线程

jobmanagers, task managers, clients

flink的运行时环境由两个进程组成:

jobmanagers ：jobmanager有时也叫masters，主要是协调分布式运行。他们调度任务，协调checkpoint，协调失败任务的恢复等等

一个flink集群中至少有一台jobmanager节点。高可用性的集群中将会有多台jobmanager节点，其中有一台是leader节点，其他的是备节点(standby)。

taskmanagers: taskmanagers有时也叫workers，taskmanager主要是执行dataflow中的任务(tasks)，缓存数据以及进行数据流的交换。

每一个集群中至少有一个taskmanager。

jobmanager和taskmanager可以有多种启动方式:直接在物理机上以的形式启动，在容器中启动以及通过资源管理框架yarn或者mesos来启动。taskmanagers与jobmanagers进行通信，发送心跳信息来告知jobmanager自己还处于活跃状态，同时接受jobmanager分配的任务。

client并不是运行时环境或者程序运行的一部分，而是用来准备数据流和将数据流发送到jobmanager中。之后client可以断开连接，或者继续保持连接来接收处理报告。client要么作为触发执行的java/scala程序的一部分，或者是在命令行进程./bin/flink run …中

taskslots and resources

每一个worker(taskmanager)是一个jvm进程，并在不同的线程中运行着一个或者多个子任务。为了控制每个worker可接受的最大任务数，每个worker需要有个task slots(任务槽)(至少有一个槽)。每一个task slot代表着taskmanager的一个固定的资源子集，例如一个taskmanager有三个slot的话，意味着该taskmanager将会分配1/3的资源到每一个slot中去。将资源纳入槽中意味着一个任务不会跟作业中的其他任务竞争托管内存，而是会保留一定的托管内存。注意：现在的slot还没有进行cpu的隔离，当前仅仅进行了托管内存的隔离。

通过调整slot的数量，用户可以自定义多少个任务之间彼此隔离。一个taskmanager有一个slot意味着每一个任务运行在一个独立的jvm进程中。有多个slot意味着多个任务共享一个jvm进程，共享jvm进程的任务之间共享tcp连接和心跳信息，同时共享数据集和数据结构，从而节省了每个任务的开销。

默认情况下，flink允许subtask(子任务)之间共享slot，即使不是来自同一个task(任务)，只要这些subtask(子任务)来自同一个作业。结果是一个槽可以持有作业的整个pipeline 。允许slot共享的有两个好处:

1、flink集群需要与作业中使用的最高并行度一样多的任务槽（task slot），不在需要再去计算一个程序中总共包含了多少了task(任务)。
2、使得获取更好的资源利用率变得更加容易，没有slot共享的话，非密集型的source/map子任务将会拆分成与密集型的window子任务一样多的资源。有了slot共享，就可以提高任务的并发数，从2个到6个，充分利用了槽的资源，也保证了子任务公平地分布在taskmanager集群中。

api中还包括了一个资源组机制，可以用来防止不需要的slot共享。

根据经验法则，最好的slot数量配置是跟cpu核数一致，对于超线程，每个slot可以分配两个或者更多的硬件线程上下文。

statebackends

存储key/value键值索引的切确数据结构取决于所选的state后端。一种state后端是将数据保存在内存的哈希map中，另一种则是以key/value的形式保存在中。除了定义保存state的数据结构，state后端还实现了一个逻辑来获取key/value state的时间点快照并作为checkpoint的一部分保存起来。

savepoints

用datastream api书写的程序可以从一个savepoint 中恢复执行。savepoint允许更新您的程序而不丢失flink中的任何state信息。

savepoints是手动触发checkpoint，获取程序的快照并将快照写入到state后端。它们依靠定期的checkpoint机制，在执行过程中程序在work节点上产生周期性快照，并生成checkpoint。对于故障恢复，只需要最新生成的checkpoint，旧的checkpoint可以在新的checkpoint生成之后就丢弃掉了。

savepoints类似于周期性的checkpoint，除了它们是由用户手动触发的，并且不会在新的checkpoint生成之后而自动过期。savepoints可以通过生成或者在取消一个作业时调用rest api产生。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

HBase Filter 过滤器之FamilyFilter详解

前言：本文详细介绍了 HBase FamilyFilter 过滤器 Java&Shell API 的使用，并贴出了相关示例代码以供参考。FamilyF... [阅读全文]
流媒体与实时计算，Netflix公司Druid应用实践

Netflix(Nasdaq NFLX)，也就是网飞公司，成立于1997年，是一家在线影片[租赁]提供商，主要提供Netflix超大数量的[DVD]并免... [阅读全文]
Spark高级算子aggregate所遇到的坑

val rdd3 = sc.parallelize(List("12","23","345"... [阅读全文]
在一个千万级的数据库查寻中，如何提高查询效率？？？？

摸清数据产生量如何，如果是1钞钟1条记录，则一台车一天就有86400条记录，则建议如下： 1、每台车使用单独的表，程序内部使用CreateTable，动... [阅读全文]
Spark中Broadcast的理解

广播变量应用场景：在提交作业后，task在执行的过程中，有一个或多个值需要在计算的过程中多次从Driver端拿取时，此时会必然会发生大量的网络IO， ... [阅读全文]
实时流式计算系统中的几个陷阱

随着诸如Apache Flink，Apache Spark，Apache Storm之类的开源框架以及诸如Google Dataflow之类的云框架的增... [阅读全文]
DataHub——实时数据治理平台

DataHub 首先，阿里云也有一款名为DataHub的产品，是一个流式处理平台，本文所述DataHub与其无关。数据治理是大佬们最近谈的一个火热的话... [阅读全文]
去 HBase，Kylin on Parquet 性能表现如何？

Kylin on HBase 方案经过长时间的发展已经比较成熟，但也存在着局限性，因此，Kyligence 推出了 Kylin on Parquet 方... [阅读全文]
如何找到Hive提交的SQL相对应的Yarn程序的applicationId

最近的工作是利用Hive做数据仓库的ETL转换，大致方式是将ETL转换逻辑写在一个hsql文件中，脚本当中都是简单的SQL语句，不包含判断、循环等存储过... [阅读全文]
HBase Filter 过滤器之RowFilter详解

前言：本文详细介绍了HBase RowFilter过滤器Java&Shell API的使用，并贴出了相关示例代码以供参考。RowFilter 基于行键... [阅读全文]