vector clock 101

前言

在现代分布式系统中，多个节点并发处理数据的场景非常常见。如何判断两个事件的先后关系？如何检测冲突？这时我们需要一种比时间戳更精确的工具 —— Vector Clock（向量时钟）。

Wiki定义如下：

A vector clock is an algorithm for generating partial ordering of events in a distributed system and detecting causality violations.

简而言之： 向量时钟是一种用于分布式系统中事件因果关系追踪的机制。

一句话：每个节点维护一个向量，记录它与其他节点的交互历史，从而判断事件间的“谁在前、谁在后”或“是否并发”。

核心思想如下：

每个节点有一个整型计数器，称为本地时钟；
每发生一个事件，本地时钟 +1；
每次消息发送，会带上当前向量；
接收消息后，将向量合并（取 max），并自身 +1；
对两个 vector clocks V1 和 V2：
- 若 V1 所有分量 ≤ V2 且至少一个 <，则 V1 happens-before V2；
- 否则两个事件是并发的（conflict）。

关注向量时钟相关的属性与指标包括：

根据与程序的集成方式：

向量时钟是一种高效的、数学精确的方式，用于在无全局时钟的前提下推理事件顺序。尽管它的使用增加了系统的复杂性和空间开销，但它在高一致性与冲突检测场景中依旧是不可替代的关键机制。