首页 > 资讯 > 精选 >web分布式系统时间、时钟和事件顺序是什么

562

分享到

web分布式系统时间、时钟和事件顺序是什么

2023-06-04 05:06:07 562人浏览八月长安

摘要

这篇文章主要介绍“WEB分布式系统时间、时钟和事件顺序是什么”，在日常操作中，相信很多人在web分布式系统时间、时钟和事件顺序是什么问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”web分布式系统时间、时钟和事

这篇文章主要介绍“WEB分布式系统时间、时钟和事件顺序是什么”，在日常操作中，相信很多人在web分布式系统时间、时钟和事件顺序是什么问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”web分布式系统时间、时钟和事件顺序是什么”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

物理时钟 vs 逻辑时钟

可能有人会问，为什么分布式系统不使用物理时钟(physical clock)记录事件？每个事件对应打上一个时间戳，当需要比较顺序的时候比较相应时间戳就好了。

这是因为现实生活中物理时间有统一的标准，而分布式系统中每个节点记录的时间并不一样，即使设置了 NTP 时间同步节点间也存在毫秒级别的偏差^[1][2]。因而分布式系统需要有另外的方法记录事件顺序关系，这就是逻辑时钟(logical clock)。

web分布式系统时间、时钟和事件顺序是什么

Lamport timestamps

Leslie Lamport 在1978年提出逻辑时钟的概念，并描述了一种逻辑时钟的表示方法，这个方法被称为Lamport时间戳(Lamport timestamps)^[3]。

分布式系统中按是否存在节点交互可分为三类事件，一类发生于节点内部，二是发送事件，三是接收事件。Lamport时间戳原理如下：

web分布式系统时间、时钟和事件顺序是什么

图1: Lamport timestamps space time (图片来源: wikipedia)

每个事件对应一个Lamport时间戳，初始值为0
如果事件在节点内发生，时间戳加1
如果事件属于发送事件，时间戳加1并在消息中带上该时间戳
如果事件属于接收事件，时间戳 = Max(本地时间戳，消息中的时间戳) + 1

假设有事件a、b，C(a)、C(b)分别表示事件a、b对应的Lamport时间戳，如果C(a) < C(b)，则有a发生在b之前(happened before)，记作 a -> b，例如图1中有 C1 -> B1。通过该定义，事件集中Lamport时间戳不等的事件可进行比较，我们获得事件的偏序关系(partial order)。

如果C(a) = C(b)，那a、b事件的顺序又是怎样的？假设a、b分别在节点P、Q上发生，P_i、Q_j分别表示我们给P、Q的编号，如果 C(a) = C(b) 并且 P_ij，同样定义为a发生在b之前，记作 a => b。假如我们对图1的A、B、C分别编号A_i = 1、B_j = 2、C_k = 3，因 C(B4) = C(C3) 并且 B_j < C_k，则 B4 => C3。

通过以上定义，我们可以对所有事件排序、获得事件的全序关系(total order)。上图例子，我们可以从C1到A4进行排序。

Vector clock

Lamport时间戳帮助我们得到事件顺序关系，但还有一种顺序关系不能用Lamport时间戳很好地表示出来，那就是同时发生关系(concurrent)^[4]。例如图1中事件B4和事件C3没有因果关系，属于同时发生事件，但Lamport时间戳定义两者有先后顺序。

Vector clock是在Lamport时间戳基础上演进的另一种逻辑时钟方法，它通过vector结构不但记录本节点的Lamport时间戳，同时也记录了其他节点的Lamport时间戳^[5][6]。Vector clock的原理与Lamport时间戳类似，使用图例如下：

web分布式系统时间、时钟和事件顺序是什么

图2: Vector clock space time (图片来源: wikipedia)__

假设有事件a、b分别在节点P、Q上发生，Vector clock分别为T_a、T_b，如果 T_b[Q] > T_a[Q] 并且 T_b[P] >= T_a[P]，则a发生于b之前，记作 a -> b。到目前为止还和Lamport时间戳差别不大，那Vector clock怎么判别同时发生关系呢？

如果 T_b[Q] > T_a[Q] 并且 T_b[P] < T_a[P]，则认为a、b同时发生，记作 a <-> b。例如图2中节点B上的第4个事件 (A:2，B:4，C:1) 与节点C上的第2个事件 (B:3，C:2) 没有因果关系、属于同时发生事件。

Version vector

基于Vector clock我们可以获得任意两个事件的顺序关系，结果或为先后顺序或为同时发生，识别事件顺序在工程实践中有很重要的引申应用，最常见的应用是发现数据冲突(detect conflict)。

分布式系统中数据一般存在多个副本(replication)，多个副本可能被同时更新，这会引起副本间数据不一致^[7]，Version vector的实现与Vector clock非常类似^[8]，目的用于发现数据冲突^[9]。下面通过一个例子说明Version vector的用法^[10]：

web分布式系统时间、时钟和事件顺序是什么

图3: Version vector

client端写入数据，该请求被S_x处理并创建相应的vector ([S_x, 1])，记为数据D1
第2次请求也被S_x处理，数据修改为D2，vector修改为([S_x, 2])
第3、第4次请求分别被S_y、S_z处理，client端先读取到D2，然后D3、D4被写入S_y、S_z
第5次更新时client端读取到D2、D3和D4 3个数据版本，通过类似Vector clock判断同时发生关系的方法可判断D3、D4存在数据冲突，最终通过一定方法解决数据冲突并写入D5

Vector clock只用于发现数据冲突，不能解决数据冲突。如何解决数据冲突因场景而异，具体方法有以最后更新为准(last write win)，或将冲突的数据交给client由client端决定如何处理，或通过quorum决议事先避免数据冲突的情况发生^[11]。

由于记录了所有数据在所有节点上的逻辑时钟信息，Vector clock和Version vector在实际应用中可能面临的一个问题是vector过大，用于数据管理的元数据(meta data)甚至大于数据本身^[12]。

解决该问题的方法是使用server id取代client id创建vector (因为server的数量相对client稳定)，或设定最大的size、如果超过该size值则淘汰最旧的vector信息^[10][13]。

到此，关于“web分布式系统时间、时钟和事件顺序是什么”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注编程网网站，小编会继续努力为大家带来更多实用的文章！

--结束END--

本文标题: web分布式系统时间、时钟和事件顺序是什么

本文链接: https://lsjlt.com/news/236613.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

web分布式系统时间、时钟和事件顺序是什么

web分布式系统时间、时钟和事件顺序是什么

redis文件事件和时间事件是什么

Linux中系统时间和硬件时间有什么关系

web分布式系统CAP的概念是什么

Linux文件分布式系统是什么

web分布式系统的基本概念是什么

Linux系统文件中的三个时间是什么

分布式文件系统FastDFS的原理是什么

Python开发注意事项：处理并发和分布式系统时的注意事项

分布式系统中使用 PHP API 时需要注意什么？

Numpy分布式文件系统的Java实现方法是什么？

vc控制台程序关闭事件时的处理方式是什么

分布式存储系统中，PHP和Apache的作用是什么？

分布式系统开发中，Python和Bash的优势分别是什么？

分布式系统中Java语言的优势和劣势是什么？

Oracle Gateway for SQL Server时2PC分布式事务异常处理的方法是什么

Python和Bash：它们在分布式系统中的角色分别是什么？

win10开机黑屏好长时间才可以进系统软件是怎么回事

Java关键字和API在分布式系统中的作用是什么？

Numpy在Java分布式系统中的优势和应用场景是什么？

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南