当前位置：移动技术网 > IT编程>软件设计>架构 > 如果有人问你CAP理论是什么，就把这篇文章发给他。

如果有人问你CAP理论是什么，就把这篇文章发给他。

2018年08月31日 | 移动技术网IT编程 | 我要评论

绝对和你在网上看到的cap定理介绍不一样。

cap 定理（cap theorem）又被称作布鲁尔定理（brewer's theorem），是加州大学伯克利分校的计算机科学家埃里克·布鲁尔（eric brewer）在 2000 年的 acm podc 上提出的一个猜想。2002 年，麻省理工学院的赛斯·吉尔伯特（seth gilbert）和南希·林奇（nancy lynch）发表了布鲁尔猜想的证明，使之成为分布式计算领域公认的一个定理。

对于设计分布式系统的架构师来说，cap 是必须掌握的理论。

为了更好地解释 cap 理论，我特意去大佬的博客看了下，作为参考基础。

（）

robert greiner 对 cap 的理解也经历了一个过程，他写了两篇文章来阐述 cap 理论，第一篇被标记为“outdated”（网上绝大部分解锁都止于第一篇）

我们先看下第一版和第二版的差异

第一版

any distributed system cannot guaranty c, a, and p simultaneously.

对于一个分布式计算系统，不可能同时满足一致性（consistence）、可用性（availability）、分区容错性（partition tolerance）三个设计约束。

1. 一致性（consistency）

all nodes see the same data at the same time.

所有节点在同一时刻都能看到相同的数据。

2. 可用性（availability）

every request gets a response on success/failure.

每个请求都能得到成功或者失败的响应。

3. 分区容忍性（partition tolerance）

system continues to work despite message loss or partial failure.

出现消息丢失或者分区错误时系统能够继续运行。

第二版

in a distributed system (a collection of interconnected nodes that share data.), you can only have two out of the following three guarantees across a write/read pair: consistency, availability, and partition tolerance - one of them must be sacrificed.

在一个分布式系统（指互相连接并共享数据的节点的集合）中，当涉及读写操作时，只能保证一致性（consistence）、可用性（availability）、分区容错性（partition tolerance）三者中的两个，另外一个必须被牺牲。

1. 一致性（consistency）

a read is guaranteed to return the most recent write for a given client.

对某个指定的客户端来说，读操作保证能够返回最新的写操作结果。

2. 可用性（availability）

a non-failing node will return a reasonable response within a reasonable amount of time (no error or timeout).

非故障的节点在合理的时间内返回合理的响应（不是错误和超时的响应）。

3. 分区容忍性（partition tolerance）

system continues to work despite message loss or partial failure.

当出现网络分区后，系统能够继续“履行职责”。

我们来详细看下具体的差异

首先概念上第二版定义了什么才是 cap 理论探讨的分布式系统，强调了两点：interconnected 和 share data，为何要强调这两点呢？因为分布式系统并不一定会互联和共享数据。最简单的例如 memcache 的集群，相互之间就没有连接和共享数据，因此 memcache 集群这类分布式系统就不符合 cap 理论探讨的对象；而 mysql 集群就是互联和进行数据复制的，因此是 cap 理论探讨的对象。

第二版强调了 write/read pair，这点其实是和上一个差异点一脉相承的。也就是说，cap 关注的是对数据的读写操作，而不是分布式系统的所有功能。例如，zookeeper 的选举机制就不是 cap 探讨的对象。

1. 一致性（consistency）

第一版强调同一时刻拥有相同数据（same time + same data），第二版并没有强调这点。

因此第一版的解释“all nodes see the same data at the same time”是不严谨的。而第二版强调 client 读操作能够获取最新的写结果就没有问题，因为事务在执行过程中，client 是无法读取到未提交的数据的，只有等到事务提交后，client 才能读取到事务写入的数据，而如果事务失败则会进行回滚，client 也不会读取到事务中间写入的数据。

2. 可用性（availability）

第一版的 success/failure 的定义太泛了，几乎任何情况，无论是否符合 cap 理论，我们都可以说请求成功和失败，因为超时也算失败、错误也算失败、异常也算失败、结果不正确也算失败；即使是成功的响应，也不一定是正确的。例如，本来应该返回 100，但实际上返回了 90，这就是成功的响应，但并没有得到正确的结果。相比之下，第二版的解释明确了不能超时、不能出错，结果是合理的，

3. 分区容忍性（partition tolerance）

第一版用的是 work，第二版用的是 function。

work 强调“运行”，只要系统不宕机，我们都可以说系统在 work，返回错误也是 work，拒绝服务也是 work；而 function 强调“发挥作用”“履行职责”，这点和可用性是一脉相承的。也就是说，只有返回 reasonable response 才是 function。相比之下，第二版解释更加明确。

虽然 cap 理论定义是三个要素中只能取两个，但放到分布式环境下来思考，我们会发现必须选择 p（分区容忍）要素，因为网络本身无法做到 100% 可靠，有可能出故障，所以分区是一个必然的现象。如果我们选择了 ca 而放弃了 p，那么当发生分区现象时，为了保证 c，系统需要禁止写入，当有写入请求时，系统返回 error（例如，当前系统不允许写入），这又和 a 冲突了，因为 a 要求返回 no error 和 no timeout。因此，分布式系统理论上不可能选择 ca 架构，只能选择 cp 或者 ap 架构。

1.cp - consistency/partition tolerance

如下图所示，为了保证一致性，当发生分区现象后, 节点1上的数据无法同步到节点2，节点2上的数据还是 y。这时客户端 c 访问节点2时，节点2 需要返回 error，提示客户端 “系统现在发生了错误”，这种处理方式违背了可用性（availability）的要求，因此 cap 三者只能满足 cp。

2.ap - availability/partition tolerance

如下图所示，为了保证可用性，当发生分区现象后，节点1上的数据无法同步到节点2，节点2上的数据还是 y。这时客户端访问节点2 时，节点2 将当前自己拥有的数据 y 返回给客户端，而实际上当前最新的数据已经是 x了，这就不满足一致性（consistency）的要求了，因此 cap 三者只能满足 ap。

如果你看到了这里，那拿出手机扫一扫，关注我，一起成长！（不定期送书哦）

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

开篇：性能问题的现状

性能问题的现状性能优化？是不是感觉这个词很高大上？刚工作2、3年的程序员甚至觉得学此技能有点早？真的是这样吗？“... [阅读全文]
7.16总结（维信小程序开发）

今天正式要做一个体育场地预约系统，用微信小程序云开发，想用博客来做一个完整的项目进展记录，记录每天的成果与收获。... [阅读全文]
ExaGrid报告显示新冠疫情期间季度业绩仍表现强劲

新客户获取表现强劲，交易额达到六至七位数。马萨诸塞州马尔伯勒--(美国商业资讯)--分层备份存储领先提供商Exa... [阅读全文]
分布式架构系列 - 分布式事务 01（基础篇）

阅读全文，约 10分钟这是江帅帅的第027篇文章1、什么是事务？一般的事务，指的是本地事务，单机上的事务。事务提... [阅读全文]
开源消息队列QMQ的设计与实现理念

文章概要背景2012 年，随着公司业务的快速增长，公司当时的单体应用架构很难满足业务快速增长的要求，和其他... [阅读全文]
闪存的物理结构

闪存芯片从小到大依此是由：cell（单元）、page（页）、block（块）、plane（平面）、die（核心）... [阅读全文]
Saas、Paas、IaaS的区别

定义层面SaaS、PaaS、IaaS都是属于云计算服务的范畴，也就是云计算+服务。来自Wiki的解释为: Cou... [阅读全文]
pomelo源码解析之组件解析（四）

文章目录消息处理组件server过滤器globalFilterService、filterService处理消息... [阅读全文]
bootloader

NVM 驱动程序包括对 NVM 的擦除(erase)、编程(program)和校验(verify)等基本操作，也... [阅读全文]
荐 kafka中的AR、ISR、LEO、HW分别是什么

AR： Assigned Replicas的缩写，是每个partition下所有副本（replicas）的统称；... [阅读全文]

网友评论


验证码：

如果有人问你CAP理论是什么，就把这篇文章发给他。

2018年08月31日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论