当前位置：移动技术网 > IT编程>网页制作>CSS > kafka和flume区别

kafka和flume区别

2020年07月17日 | 移动技术网IT编程 | 我要评论

Flume更趋向于消息采集系统，Kafka更趋向于消息缓存系统。
kafka:目前项目中主要是用来做消息推送中间件，消息的处理完全由业务方自己定义，请求频次单机吞吐量轻轻松松50W+/s，数据在集群不全挂的情况下是不会丢数据，消费也很灵活，可以指定分区和offset，可以当做成一个数据库。
flume:用来做数据采集和落地，目前使用的是flume-ng，流程是source(kafka)->channel->hdfs 相比较kafka比较轻量级，就是一个数据的流通管道，当一个flume实例挂了数据会丢失。
Flume架构简单，依赖少，功能也简单，但是够灵活，它的定位是数据通道，不是消息队列。
Flume的Source-Channel-Sink模型，非常适合作为日志收集的模型。
Kafka就不必多说了，生产者消费者模型，看你怎么去构建日志消费的下游了。有了消息队列作为中间件，消费的下游和上游可以完美的解耦。
Kafka是pull based, 如果你有很多下游的Data Consumer，用Kafka；
Kafka有Replication，Flume没有，如果要求很高的容错性(Data High Availability)，选kafka；
需要更好的Hadoop类产品接口，例如HDFS，HBase等，用Flume。
flume是海量日志采集、聚合和传输的日志收集系统，kafka是一个可持久化的分布式的消息队列。
Flume可以使用拦截器实时处理数据，对数据屏蔽或者过滤很有用，如果数据被设计给Hadoop使用，可以使用Flume，重在数据采集阶段。
采集和处理数据不一定同步，所以用kafka这个消息中间件来缓冲，重在数据接入。
kafka就是消息队列，对日志采集系统来说是做缓存用的，供实时的应用读取。
当你只想进行日志的收集工作时，可直接用flume。
如果你收集了日志后，想输出到多个业务方，则可结合kafka。
kafka是消息队列，可支持多个业务来读取数据。
由于前端一般都会做负载均衡，所以日志源会有多个，而公司可能只有一个统一的实时计算平台。所以在这个中间一般都会采用消息队列来缓存。
Kafka 是一个通用型系统。你可以有许多的生产者和消费者分享多个主题。相反地，Flume 被设计成特定用途的工作，特定地向 HDFS 和 HBase 发送出去。Flume 为了更好地为 HDFS 服务而做了特定的优化，并且与 Hadoop 的安全体系整合在了一起。基于这样的结论，Hadoop 开发商 Cloudera 推荐如果数据需要被多个应用程序消费的话，推荐使用 Kafka，如果数据只是面向 Hadoop 的，可以使用 Flume。
Flume 拥有许多配置的来源 (sources) 和存储池 (sinks)。然后，Kafka 拥有的是非常小的生产者和消费者环境体系，Kafka 社区并不是非常支持这样。如果你的数据来源已经确定，不需要额外的编码，那你可以使用 Flume 提供的 sources 和 sinks，反之，如果你需要准备自己的生产者和消费者，那你需要使用 Kafka。
Flume 可以在拦截器里面实时处理数据。这个特性对于过滤数据非常有用。Kafka 需要一个外部系统帮助处理数据。
无论是 Kafka 或是 Flume，两个系统都可以保证不丢失数据。然后，Flume 不会复制事件。相应地，即使我们正在使用一个可以信赖的文件通道，如果 Flume agent 所在的这个节点宕机了，你会失去所有的事件访问能力直到你修复这个受损的节点。使用 Kafka 的管道特性不会有这样的问题。
Flume 和 Kafka 可以一起工作的。如果你需要把流式数据从 Kafka 转移到 Hadoop，可以使用 Flume 代理 (agent)，将 kafka 当作一个来源 (source)，这样可以从 Kafka 读取数据到 Hadoop。你不需要去开发自己的消费者，你可以使用 Flume 与 Hadoop、HBase 相结合的特性，使用 Cloudera Manager 平台监控消费者，并且通过增加过滤器的方式处理数据。

本文地址：https://blog.csdn.net/qq_38262266/article/details/107377765

您可能感兴趣的文章:

使用css样式，制作表格（小程序）

效果图：wxml:<view class="table-wrap"><view class="... [阅读全文]
清除新版Google Chrome浏览器中表单控件（input，button...）默认的黑色边框

今天在chrome浏览器上测试项目时，突然发现所有的表单控件都被加上了一个奇怪的黑色边框，翻了半天css文件后，... [阅读全文]
4.3 人脸融合应用程序的设计

文章目录4.3 人脸融合应用程序的设计4.3 人脸融合应用程序的设计ManyMasks软件打开之后,将展现一个实... [阅读全文]
LeetCode解析------155.最小栈-设计

题目：设计一个支持 push ，pop ，top 操作，并能在常数时间内检索到最小元素的栈。push(x) ——... [阅读全文]
4.复杂选择器、权重计算、css基础属性

CSS权重!importantInfinity行间样式1000id100class/属性/伪类10标签/伪元素1... [阅读全文]
荐 20200714——git/mac配置/项目运行步骤/一些报错

分布式：GIT工作模式下，每个开发者（安装了git客户端）的电脑就等同于传统SVN服务器svn工作模式：co... [阅读全文]
antd 菜单组件使用时报错：Cannot read property ‘isRootMenu‘ of undefined

项目中使用了antd ui框架，在使用Menu组件得SubMenu组件时报出以下错误：Uncaught Type... [阅读全文]
CSS|div的style=“background-image: url(img/a.bmp)图片显示不出来

div的style="background-image: url(img/a.bmp)图片显示不出来首先我的di... [阅读全文]
硬件仪表盘账号建立指导（一） --WHQL认证测试结果提交账号（一）

WHQL提交账户建立指南建立Microsoft 帐户如果你有hotmail，outlook，OneDriver，... [阅读全文]
cookie的规范Cookie的不可跨域名性或Cookie与域名的关系

前些天在开发中遇到了关于浏览器cookie的一些小细节问题。例如：我创建的一个小购物车的web项目。用ngi... [阅读全文]

网友评论


验证码：

kafka和flume区别

2020年07月17日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论