当前位置：移动技术网 > 网络运营>推广>网站建设 > 剖析Twitter的实时信息分析服务Answers的架构

剖析Twitter的实时信息分析服务Answers的架构

2018年04月26日 | 移动技术网网络运营 | 我要评论

2014年twitter发布了answers，至今移动社区产生了惊人的使用量，让twitter感到兴奋不已。现在answers每天处理50亿次会话，并且这个数量在持续增加。上亿设备每秒向answers端点发送数以百万计的请求。在你已经阅读到此处的这段时间里，answers后台收到并处理了一千万次分析事件。

其中的挑战是如何利用这些信息向移动开发者提供可靠的、实时的、有实际价值的洞见（视角）去了解他们的移动应用。

在高层，twitter依靠组件解耦、异步通信、在应对灾难性故障时优雅地服务降级等原则来帮助架构决策。twitter使用lambda架构将数据完整性和实时数据更新结合起来。

在实践过程中，twitter需要设计一个能够接收并保存事件、执行离线和实时计算且能将上述两种计算结果整合成相关信息的系统。这些行为全部都要以百万次每秒的规模执行。

让twitter从第一个挑战开始：接受并处理这些事件。

事件接收

在设计设备-服务器通信的时候，twitter的目标是：减少对电池和网络使用的影响；确保数据的可靠性；接近实时地获取数据。为了减少对设备的影响，twitter批量地发送分析数据并且在发送前对数据进行压缩。为了保证这些宝贵的数据始终能够到达twitter的服务器，在传输失败随机退避后以及达到设备存储达到上限时，设备会进行重传。为了确保数据能够尽快到达服务器，twitter设置来多个触发器来使设备尝试发送：当程序运行于前台的时候，事件触发器每分钟触发一次；一个消息数量触发器和程序转入后台触发器。

这样的通信协议导致设备每秒发送来数以万计压缩过的有效载荷。每一个载荷都包含数十条事件。为了能够可靠的、易于线性伸缩的方式去处理载荷，接收事件的服务必须极度简单。
201633100026455.jpg (555×241)

这个服务使用go语言编写，这个服务使用了亚马逊弹性负载均衡器（elb），并将每一个消息负荷放入一个持久化的kafka队列。

存储

kafka是一个持久存储器，因为它把收到的消息写入磁盘并且每个消息都有多份冗余。因此一旦twitter知道信息到了kafka队列，twitter就可以通过延迟处理、再处理来容忍下游延迟和下游失败。然而，kafka不是twitter历史数据的永久真理之源——按照上文提到的速度，仅仅是几天的数据，twitter也需要数以百计的box来存储。因此twitter把kafka集群配置为将消息只保留几个小时（这些时间足够twitter处理不期而至的重大故障）并且将数据尽快地存入永久存储——亚马逊简易存储服务（amazon s3）。
201633100048018.jpg (555×241)

twitter广泛地使用storm来进行实时数据处理，第一个相关的topology就是从kafka读取信息并存储到amazon s3上。

批量计算

一旦这些数据存到了s3上，twitter可以使用亚马逊弹性mapreduce（amazon emr）来计算twitter的数据能够计算的任何东西。这既包括要展示在客户的仪表盘上的数据，也包括twitter为了开发新功能而开发的实验性的任务。
201633100111484.jpg (555×246)

twitter使用cascading框架编写、amazon emr执行mapreduce程序。 amazon emr将twitter存储到s3上的数据作为输入，处理完毕后，再将结果存入s3。twitter通过运行在storm上的调度topology来探测程序执行完毕，并将结果灌入cassandra集群，这样结果就能用于亚秒级查询api。

实时计算

迄今，twitter描述的是一个能够执行分析计算的持久的容错的框架。然而，存在一个显眼的问题——这个框架不是实时的。一些计算每小时计算一次，有的计算需要一整天的数据作为输入。计算时间从几分钟到几小时不等，把s3上的输出导入到服务层也需要这么多时间。因此，在最好情况下，twitter的数据也总是拖后几个小时，显然不能满足实时和可操作的目标。

为了达成实时的目标，数据涌入后进行存档的同时，twitter对数据进行流式计算。
201633100129981.jpg (555×231)

就像twitter的存储topology读取数据一样，一个独立的storm topology实时地从kafka topic中读取数据然后进行实时计算，计算的逻辑和mapreduce任务一样。这些实时计算的结果放在另一个独立的cassandra集群里以供实时查询。

为了弥补twitter在时间以及在资源方面可能的不足，twitter没有在批量处理层中而是在实时计算层中使用了一些概率算法，如布隆过滤器、hyperloglog（也有一些自己开发的算法）。相对于那些蛮力替代品，这些算法在空间和时间复杂度上有数量级的优势，同时只有可忽略的精确度损失。

合并

现在twitter拥有两个独立生产出的数据集（批处理和实时处理），twitter怎么将二者合并才能得到一个一致的结果？
201633100148221.jpg (555×333)

twitter在api的逻辑中，根据特定的情况分别使用两个数据集然后合并它们。

因为批量计算是可重现的，且相对于实时计算来说更容错，twitter的api总是倾向于使用批量产生的数据。例如，api接到了一个三十天的时间序列的日活跃用户数量数据请求，它首先会到批量数据cassandra集群里查询全范围的数据。如果这是一个历史数据检索，所有的数据都已经得到。然而，查询的请求更可能会包含当天，批量产生的数据填充了大部分结果，只有近一两天的数据会被实时数据填充。

错误处理

让twitter来温习几个失效的场景，看一下这样的架构在处理错误的时候，是如何避免宕机或者损失数据，取之以优雅地降级。

twitter在上文中已经讨论过设备上的回退重试策略。在设备端网络中断、服务器端短时无服务情况下，重试保证数据最终能够到达服务器。随机回退确保设备不会在某区域网络中断或者后端服务器短时间不可用之后，不会压垮（ddos攻击）服务器。

当实时处理层失效时，会发生什么？twitter待命的工程师会受到通知并去解决问题。因为实时处理层的输入是存储在持久化的kafka集群里，所以没有数据会丢失；等实时处理恢复之后，它会赶上处理那些停机期间应该处理的数据。

因为实时处理和批处理是完全解耦的，批处理层完全不会受到影响。因此唯一的影响就是实时处理层失效期间，对数据点实时更新的延迟。

如果批处理层有问题或者严重延迟的话，会发生什么？twitter的api会无缝地多获取实时处理的数据。一个时间序列数据的查询，可能先前只取一天的实时处理结果，现在就需要查询两到三天的实时处理结果。因为实时处理和批处理是完全解耦的，实时处理不受影响继续运行。同时，twitter的待命工程师会得到消息并且解决批处理层的问题。一旦批处理层恢复正常，它会执行那些延迟的数据处理任务，api也会无缝切换到使用现在可以得到的批处理的结果。

twitter系统后端架构由四大组件构成：事件接收，事件存储，实时计算和批量计算。各个组件之间的持久化队列确保任意组件的失效不会扩散到其他组件，并且后续可以从中断中恢复。api可以在计算层延迟或者失效时无缝地优雅降级，在服务恢复后重新恢复；这些都是由api内部的检索逻辑来保证的。

answer的目标是创建一个仪表盘，这个仪表盘能够把了解你的用户群变得非常简单。因此你可以将时间花费在打造令人惊叹的用户体验上，而不是用来掘穿数据。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

移动建站即将进入免费时代

互联网是一片奇异的免费乐土，“免费经济学”的兴起就是在它的推动下出现的。 [阅读全文]
做好微网站的网站建设，我与你同行

导语：如果说微信改变了人们的生活习惯，那么微网站就是改变行业的营销方式，彼时微网站的网站建设就是新营销方式的骨架。既然在这里谈到微信的网站建设，那就不得不先给腾... [阅读全文]
总结备案不用关闭网站的9种方法

备案这个问题一直困扰很多草根站长，我也不例外。最近很想把空间搬回国内，但是国内的空间都需要备案，众所周知备案中为了提高通过率，接入商都是要求闭站的。但是问题来了... [阅读全文]
菜鸟站长应该如何防止网站被恶意攻击

随着互联网的发展，很多人都已经有了自己的网站。无论是企业，商家还是个人。以前，做一个网站都得在上千上万元。如今，网站建设的的价格也不再那么贵了，几百块钱就可以做... [阅读全文]
以一个销售人员的角色来做推广

总而言之，现在的推广不用再想以前那样，只是单纯的以做流量为主了，我们必须要从一个销售人员的思维角度，来诠释推广的过程。用心的掌握好公司的产品知识，把握住各类客户... [阅读全文]
最新江湖家居系统ZXV5.2.20141122更新安装包_多套模板源码

2014.11.22日，江湖家居门户系统全新安装包更新补丁正式发布，从官方发布的本次安装包更新日志中可以看出，有很多功能都被完善，更加符合用户需求和体验，下面就... [阅读全文]
美国主机助力外贸电商发展

首届世界互联网大会19日在乌镇开幕，来自全球100多个国家的上千名政经领袖和互联网大佬在此共议全球化背景下互联网发展和未来趋势。本届大会的胜利召开，引爆了电商尤... [阅读全文]
购物商城网站建设中完美的用户体验七要素

网站制作中什么是完美的购物体验或用户体验?这里有没有标准呢，时下，做网站建设言必讲用户体验，那么什么才是好的用户体验?在这里我以一个用得比较多的B2C网上商城来... [阅读全文]
建设官网如何设计更利于吸引用户

不用小编续说，大家都知道官网的重要性。在上篇《浅析企业网站改版的重要性》中已经阐述企业网站的重要性。今天，跟大家分享的是：建设官网如何设计更利于吸引用户。先来对... [阅读全文]
如何建设一个百度和用户都喜爱的站点

作为一个站长，建站技能是我们最基础的应该掌握的基础技能，随着互联网的不断进步，当下人们对于网站要求越来越高，笔者认为一个站点我们不必追求过于花哨的表现，但是给蜘... [阅读全文]

网友评论


验证码：

剖析Twitter的实时信息分析服务Answers的架构

2018年04月26日 | 移动技术网网络运营 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论