当前位置：移动技术网 > IT编程>软件设计>架构 > 荐 kafka中的AR、ISR、LEO、HW分别是什么

荐 kafka中的AR、ISR、LEO、HW分别是什么

2020年07月14日 | 移动技术网IT编程 | 我要评论

AR： Assigned Replicas的缩写，是每个partition下所有副本（replicas）的统称；
ISR： In-Sync Replicas的缩写，是指副本同步队列，ISR是AR中的一个子集；
LEO：LogEndOffset的缩写，表示每个partition的log最后一条Message的位置。
HW： HighWatermark的缩写，是指consumer能够看到的此partition的位置。取一个partition对应的ISR中最小的LEO作为HW，consumer最多只能消费到HW所在的位置。

前言

在前面写的 Kafka架构和工作流程深入解析一文中介绍kafka的文件存储机制时说到过，kafka中为了防止log文件过大导致数据定位效率低下而采取了分片和索引机制，将每个物理上的partition分为多个segment。每个segment对应两个文件——“.index”文件和“.log”文件。“.index”文件存储大量的索引信息，“.log”文件存储大量的数据，索引文件中的元数据指向对应数据文件中message的物理偏移地址。

但是对于上层应用来说，可以将partition看成最小的存储单元（一个由多个segment文件拼接而成的“巨型”文件），每个partition都由一些列有序的、不可变的消息组成，这些消息被连续的追加到partition中。

Kafka中的多副本机制

在Kafka中为了提高消息的可靠性，每个topic的partition有N个副本（replicas），其中N(大于等于1)是topic的复制因子（replica fator）的个数。Kafka通过多副本机制实现故障自动转移，当Kafka集群中一个broker失效情况下仍然保证服务可用。在Kafka中发生复制时确保partition的日志能有序地写到其他节点上，N个replicas中，其中一个replica为leader，其他都为follower, leader处理partition的所有读写请求，与此同时，follower会被动定期地去复制leader上的数据。

如下图所示，Kafka集群中有4个broker, 某topic有3个partition,且复制因子（即副本个数）也为3：

Kafka提供了数据复制算法保证，如果leader发生故障或挂掉，一个新leader被选举并被接受客户端的消息成功写入。Kafka确保从同步副本列表中选举一个副本为leader，或者说follower追赶leader数据。leader负责维护和跟踪ISR(In-Sync Replicas的缩写，表示副本同步队列)中所有follower滞后的状态。当producer发送一条消息到broker后，leader写入消息并复制到所有follower。消息提交之后才被成功复制到所有的同步副本。消息复制延迟受最慢的follower限制，重要的是快速检测慢副本，如果follower“落后”太多或者失效，leader将会把它从ISR中删除。

ISR和AR

ISR (In-Sync Replicas)，这个是指副本同步队列。副本数对Kafka的吞吐率是有一定的影响，但极大的增强了可用性。默认情况下Kafka的replica数量为1，即每个partition都有一个唯一的leader，为了确保消息的可靠性，通常应用中将其值(由broker的参数offsets.topic.replication.factor指定)大小设置为大于1，比如3。所有的副本（replicas）统称为Assigned Replicas，即AR。ISR是AR中的一个子集，由leader维护ISR列表，follower从leader同步数据有一些延迟（包括延迟时间replica.lag.time.max.ms和延迟条数replica.lag.max.messages两个维度, 当前最新的版本0.10.x中只支持replica.lag.time.max.ms这个维度），任意一个超过阈值都会把follower剔除出ISR, 存入OSR（Outof-Sync Replicas）列表，新加入的follower也会先存放在OSR中。AR=ISR+OSR。

为什么在Kafka 0.9.0.0版本后移除了replica.lag.max.messages参数而只保留了replica.lag.time.max.ms作为ISR中副本管理的参数呢？

replica.lag.max.messages表示当前某个副本落后leader的消息数量超过了这个参数的值，那么leader就会把follower从ISR中删除。假设设置replica.lag.max.messages=4，那么如果producer一次传送至broker的消息数量都小于4条时，因为在leader接受到producer发送的消息之后而follower副本开始拉取这些消息之前，follower落后leader的消息数不会超过4条消息，故此没有follower移出ISR，所以这时候replica.lag.max.message的设置似乎是合理的。但是producer发起瞬时高峰流量，producer一次发送的消息超过4条时，也就是超过replica.lag.max.messages，此时follower都会被认为是与leader副本不同步了，从而被踢出了ISR。但实际上这些follower都是存活状态的且没有性能问题。那么在之后追上leader,并被重新加入了ISR。于是就会出现它们不断地剔出ISR然后重新回归ISR，这无疑增加了无谓的性能损耗。而且这个参数是broker全局的。设置太大了，影响真正“落后”follower的移除；设置的太小了，导致follower的频繁进出。无法给定一个合适的replica.lag.max.messages的值，故此，新版本的Kafka移除了这个参数。

HW和LEO

上面有简单说到HW是HighWatermark的缩写，是指consumer能够看到的此partition的位置；而LEO是LogEndOffset的缩写，表示每个partition的log最后一条Message的位置。也就是，我们取一个partition对应的ISR中最小的LEO作为HW，consumer最多只能消费到HW所在的位置。

每个replica都有自己的HW，leader和follower各自负责更新自己的HW的状态。对于leader新写入的消息，consumer不能立刻消费，leader会等待该消息被所有ISR中的replicas同步后更新HW，此时消息才能被consumer消费。这样就保证了如果leader所在的broker失效，该消息仍然可以从新选举的leader中获取。对于来自内部broker的读取请求，没有HW的限制。

下图详细的说明了当producer生产消息至broker后，ISR以及HW和LEO的流转过程：

由此可见，Kafka的复制机制既不是完全的同步复制，也不是单纯的异步复制。

事实上，同步复制要求所有能工作的follower都复制完，这条消息才会被commit，这种复制方式极大的影响了吞吐率。而异步复制方式下，follower异步的从leader复制数据，数据只要被leader写入log就被认为已经commit，这种情况下如果follower都还没有复制完，落后于leader时，突然leader宕机，则会丢失数据。而Kafka的这种使用ISR的方式则很好的均衡了确保数据不丢失以及吞吐率。

Kafka的ISR的管理最终都会反馈到Zookeeper节点上。具体位置为：/brokers/topics/[topic]/partitions/[partition]/state

目前有两个地方会对这个Zookeeper的节点进行维护：

Controller来维护：Kafka集群中的其中一个Broker会被选举为Controller，主要负责Partition管理和副本状态管理，也会执行类似于重分配partition之类的管理任务。在符合某些特定条件下，Controller下的LeaderSelector会选举新的leader，ISR和新的leader_epoch及controller_epoch写入Zookeeper的相关节点中。同时发起LeaderAndIsrRequest通知所有的replicas。
leader来维护：leader有单独的线程定期检测ISR中follower是否脱离ISR, 如果发现ISR变化，则会将新的ISR的信息返回到Zookeeper的相关节点中。

本文地址：https://blog.csdn.net/weixin_43230682/article/details/107317839

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

高并发实时性网络视频监控项目实战

项目概述：【备注】本项目开发流程，将依次按照上述开发步骤编排，后续将出第一篇.... ... [阅读全文]
十分钟教条与经验，轻松搞定系统分析师的案例分析

十分钟教条与经验，轻松搞定系统分析师的案例分析前言系统分析师培训班通过统计，得到一个结论：培训班的考生，死得最多的就是案例分析。为什么呢？因为客观... [阅读全文]
谷歌浏览器中预览海康大华等监控视频的思路与方法

随着现代社会不断发展，对于安防行业的需求也越来越多。近年来，各大安防厂商如雨后春笋一般不断涌现，以视频监控为主的海康、大华、宇视；以门禁为主的钮贝尔等... [阅读全文]
14、Ribbon整合断路器监控Hystrix Dashboard

上一篇只是大概介绍了一下断路器Hystrix Dashboard监控，如何使用Hystrix Dashboard监控微服务的状态呢？这篇看看Ribbon... [阅读全文]
十分钟脑图加说明，搞定系统分析师的绝对核心-需求工程

十分钟脑图加说明，搞定系统分析师的绝对核心需求工程前言分析师系列，我已经很久没有写了。因为系统分析师的考试内容与系统架构设计师的考试内容有许多重... [阅读全文]
Spring 学习一（了解Spring）

1.Spring 框架的概念？ Spring框架是一个开放源代码的J2EE应用程序框架，由Rod Johnson发起，是针对bean的生命周期... [阅读全文]
系统模块划分设计的思考

系统模块划分设计的思考前言首先明确一下，这里所说的系统模块划分，是针对client，service，common这样的技术划分，而不是针对具体业务的... [阅读全文]
细谈八种架构涉及模式及其优缺点概述

一、什么是架构我想这个问题，十个人回答得有十一个答案，因为另外的那一个是大家妥协的结果，哈哈，我理解，架构就是骨架，如下图所示：人类的身体的支撑是主... [阅读全文]
消息队列全面了解

消息队列都应用到了哪些实际的应用场景中？一、再谈消息队列的应用场景 1、异步处理：例如短信通知、终端状态推送、App推送、用户注册等 2、数据同部：业... [阅读全文]
搞懂 XML 解析，徒手造 WEB 框架

恕我斗胆直言，对开源的 WEB 框架了解多少，有没有尝试写过框架呢？XML 的解析方式有哪些？能答出来吗？！心中没有答案也没关系，因为通过今天的分享，... [阅读全文]

网友评论


验证码：