当前位置：移动技术网 > 网络运营>服务器>Linux > 1、Kafka整体介绍

1、Kafka整体介绍

2020年07月28日 | 移动技术网网络运营 | 我要评论

https://www.jianshu.com/p/d3e963ff8b70

1 kafka作用

kafka是一个分布式消息队列。具有高性能、高可用、持久化、多副本、横向扩展的能力。生产者往队列里写消息，消费者从队列里取消息进行业务处理。一般在架构设计中起到解耦、异步、削峰处理的作用。

1.1 解耦

场景：A 系统发送数据到 BCD 三个系统，通过接口调用发送。如果 E 系统也要这个数据？如果 C 系统现在不需要了呢？那这样 A 系统负责人几乎会崩溃…

在这个场景中，A 系统跟其它各种乱七八糟的系统严重耦合，A 系统产生一条比较关键的数据，很多系统都需要 A 系统将这个数据发送过来。A 系统要时时刻刻考虑 BCDE 四个系统如果挂了该咋办？要不要重发，要不要把消息存起来？头发都白了啊！

如果使用 MQ，A 系统产生一条数据，发送到 MQ 里面去，哪个系统需要数据自己去 MQ 里面消费。如果新系统需要数据，直接从 MQ 里消费即可；如果某个系统不需要这条数据了，就取消对 MQ 消息的消费即可。这样下来，A 系统压根儿不需要去考虑要给谁发送数据，不需要维护这个代码，也不需要考虑人家是否调用成功、失败超时等情况。

总结：通过一个 MQ，Pub/Sub 发布订阅消息这么一个模型，A 系统就跟其它系统彻底解耦了。

画外音：你需要去考虑一下你负责的系统中是否有类似的场景，就是一个系统或者一个模块，调用了多个系统或者模块，互相之间的调用很复杂，维护起来很麻烦。但是其实这个调用是不需要直接同步调用接口的，如果用 MQ 给它异步化解耦，也是可以的，你就需要去考虑在你的项目里，是不是可以运用这个 MQ 去进行系统的解耦。在简历中体现出来这块东西，用 MQ 作解耦。

1.2 异步

场景：A 系统接收一个请求，需要在自己本地写库，还需要在 BCD 三个系统写库，自己本地写库要 3ms，BCD 三个系统分别写库要 300ms、450ms、200ms。最终请求总延时是 3 + 300 + 450 + 200 = 953ms，接近 1s，用户感觉搞个什么东西，慢死了慢死了。用户通过浏览器发起请求，等待个 1s，这几乎是不可接受的。

一般互联网类的企业，对于用户直接的操作，一般要求是每个请求都必须在 200 ms 以内完成，对用户几乎是无感知的。

如果使用 MQ，那么 A 系统连续发送 3 条消息到 MQ 队列中，假如耗时 5ms，A 系统从接受一个请求到返回响应给用户，总时长是 3 + 5 = 8ms，对于用户而言，其实感觉上就是点个按钮，8ms 以后就直接返回了！

1.3 削峰

每天 0:00 到 12:00，A 系统风平浪静，每秒并发请求数量就 50 个。结果每次一到 12:00 ~ 13:00 ，每秒并发请求数量突然会暴增到 5k+ 条。但是系统是直接基于 MySQL 的，大量的请求涌入 MySQL，每秒钟对 MySQL 执行约 5k 条 SQL。

一般的 MySQL，扛到每秒 2k 个请求就差不多了，如果每秒请求到 5k 的话，可能就直接把 MySQL 给打死了，导致系统崩溃，用户也就没法再使用系统了。但是高峰期一过，到了下午的时候，就成了低峰期，可能也就 1w 的用户同时在网站上操作，每秒中的请求数量可能也就 50 个请求，对整个系统几乎没有任何的压力。

如果使用 MQ，每秒 5k 个请求写入 MQ，A 系统每秒钟最多处理 2k 个请求，因为 MySQL 每秒钟最多处理 2k 个。A 系统从 MQ 中慢慢拉取请求，每秒钟就拉取 2k 个请求，不要超过自己每秒能处理的最大请求数量就 ok，这样下来，哪怕是高峰期的时候，A 系统也绝对不会挂掉。而 MQ 每秒钟 5k 个请求进来，就 2k 个请求出去，结果就导致在中午高峰期（1 个小时），可能有几十万甚至几百万的请求积压在 MQ 中。

这个短暂的高峰期积压是 ok 的，因为高峰期过了之后，每秒钟就 50 个请求进 MQ，但是 A 系统依然会按照每秒 2k 个请求的速度在处理。所以说，只要高峰期一过，A 系统就会快速将积压的消息给解决掉。

2 kafka整体流程

kafka对外使用topic的概念，生产者往topic里写消息，消费者从topic中读消息。为了做到水平扩展，一个topic实际是由多个partition组成的，遇到瓶颈时，可通过增加partition的数量来进行横向扩容，单个parition内是保证消息有序。每新写一条消息，kafka就是在对应的文件append写，所以性能非常高。kafka的总体数据流是这样的：

Producers往Brokers里面的指定Topic中写消息，Consumers从Brokers里面拉去指定Topic的消息，然后进行业务处理。

图中有两个topic：topic 0有两个partition，topic 1有一个partition，三副本备份。可以看到consumer gourp 1中的consumer 2没有分到partition处理，这是有可能出现的，下面会讲到。关于broker、topics、partitions的一些元信息用zk来存，监控和路由也都会用到zk。

3 生产者

创建一条记录，记录中一个要指定对应的topic和value，key和partition可选。先序列化，然后按照topic和partition，放进对应的发送队列中。kafka produce都是批量请求，会积攒一批，然后一起发送，不是调send()就进行立刻进行网络发包。如果partition没填，那么情况会是这样的：

key有填：按照key进行哈希，相同key去一个partition。（如果扩展了partition的数量那么就不能保证了）
key没填：round-robin来选partition

这些要发往同一个partition的请求按照配置，攒一波，然后由一个单独的线程一次性发过去。

2.1

本文地址：https://blog.csdn.net/jiang7chengzi/article/details/107598335

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Webservice远程调试及超时操作原理解析

webservice远程调试在.net 中已经默认将webservice的远程调试功能关闭，有的时候我们需要远程调试程序的时候，就需要打开此功能我们只需在web... [阅读全文]
如何在Ubuntu 18.04（实体机）上配置OpenWRT的开发环境

一、安装虚拟机（实体机）安装虚拟机或者实体机都可以，刚上手建议安装虚拟机，选择16.04版本或者18.04版本都ok，其openwrt开发环境的搭建过程大同小异... [阅读全文]
linux下快速列出局域网中所有主机名（计算机名）的脚本

最近有列出局域网中所有主机名的需求（smb协议里的），但是findsmb命令总是列不全，搜了搜网上也没什么现成的解决方案，于是自己写了个python脚本脚本会扫... [阅读全文]
Linux下遇到PyCurl的错误解决方法

could not run curl-config 的解决方式downloading/unpacking pycurl (from pyspider) down... [阅读全文]
NOWCODER 小M和天平（动态规划DP）

链接：https://ac.nowcoder.com/acm/problem/13586来源：牛客网题意：小M想... [阅读全文]
树莓派学习——库的概念和简单编程

Linux 共享库、静态库、动态库解析：库：Linux库的概念1. 介绍程序函数库可分为3种类型：静态函数库（... [阅读全文]
嵌入式学习经历帖

随着科技的进步，全凭机械结构完成各种运动的时代已经渐行渐远，不过我仍然对于之前创造的各种运动机构着迷。现在技术的... [阅读全文]
PCI子系统（三）- PCI设备驱动

这里拿linux/drivers/leds/leds-ss4200.c来做模板参考学习注册struct pci_... [阅读全文]
Linux下QT5以上版本串口的最简单实现（测试可用）

Linux下QT5以上版本串口的最简单实现（测试可用）1. 简介简简单单一个串口，在Linux环境下踩了无数的雷... [阅读全文]
Linux C/C++ 中锁的使用总结

本文总结C和C++中各种锁以及使用方式，主要是C语言中的互斥锁 mutex 和读写锁 rwlock，以及C++中... [阅读全文]