转自:https://zhuanlan.zhihu.com/p/45566448
这篇文章主要介绍内存顺序(Memory Order),然后会结合 RocksDB | LevelDB 中的 SkipList 源码来具体分析 RocksDB SkipList 如何通过内存顺序和原子操作做到无锁并发(一写多读)。
内存顺序描述了计算机 CPU 获取内存的顺序,内存的排序既可能发生在编译器编译期间,也可能发生在 CPU 指令执行期间。
为了尽可能地提高计算机资源利用率和性能,编译器会对代码进行重新排序, CPU 会对指令进行重新排序、延缓执行、各种缓存等等,以达到更好的执行效果。当然,任何排序都不能违背代码本身所表达的意义,并且在单线程情况下,通常不会有任何问题。
但是在多线程环境下,比如无锁(lock-free)数据结构的设计中,指令的乱序执行会造成无法预测的行为。所以我们通常引入内存栅栏(Memory Barrier)这一概念来解决可能存在的并发问题。
内存栅栏是一个令 CPU 或编译器在内存操作上限制内存操作顺序的指令,通常意味着在 barrier 之前的指令一定在 barrier 之后的指令之前执行。
在 C11/C++11 中,引入了六种不同的 memory order,可以让程序员在并发编程中根据自己需求尽可能降低同步的粒度,以获得更好的程序性能。这六种 order 分别是:
relaxed, acquire, release, consume, acq_rel, seq_cst
memory_order_relaxed: 只保证当前操作的原子性,不考虑线程间的同步,其他线程可能读到新值,也可能读到旧值。比如 C++ shared_ptr 里的引用计数,我们只关心当前的应用数量,而不关心谁在引用谁在解引用。
memory_order_release:(可以理解为 mutex 的 unlock 操作)
memory_order_acquire: (可以理解为 mutex 的 lock 操作)
c = 0; thread 1: { a = 1; b.store(2, memory_order_relaxed); c.store(3, memory_order_release); } thread 2: { while (c.load(memory_order_acquire) != 3) ; // 以下 assert 永远不会失败 assert(a == 1 && b == 2); assert(b.load(memory_order_relaxed) == 2); }
memory_order_consume:
a = 0; c = 0; thread 1: { a = 1; c.store(3, memory_order_release); } thread 2: { while (c.load(memory_order_consume) != 3) ; assert(a == 1); // assert 可能失败也可能不失败 }
memory_order_acq_rel:
memory_order_seq_cst:(顺序一致性)
通常情况下,默认使用 memory_order_seq_cst,所以你如果不确定怎么这些 memory order,就用这个。
以上就是这六种 memory_order 的简单介绍,除此之外还有些重要的概念,比如 sequence-before, happens-before 等等,具体可以参考 std::memory_order - cppreference.com。
下面我们结合代码具体看下 RocksDB SkipList 中的 memory order 使用。这部分内容需要你提前熟悉下相关代码。
RocksDB SkipList 支持一写多读。它涉及了三种 memory order,包括 relaxed, release 和 acquire。
一写多读有以下几点限制:
我们把所有涉及 memory order 的操作分为三类:
1. 读到旧的 max_height_:不影响查找,我们可能读取到新插入的节点也可能读不到 2. 读到新的 max_height_: a. 读到 head_ 指向的旧节点,那么当我们查找 key 时,会发现 head_ 指向 nullptr,那么会立即下降到下一层 b. 读到 head_ 指向的新插入节点,那么会使用这个新节点进行查找
for (int i = 0; i < height; i++) { x->NoBarrier_SetNext(i, prev_[i]->NoBarrier_Next(i)); // relaxed prev_[i]->SetNext(i, x); // release }
对于正在初始化的节点来说,我们使用 relaxed 语义,即 NoBarrier_SetNext() 和 NoBarrier_Next(),因为这时候节点还没有正式被加入到 SkipList,即对读线程不可见,所以可以使用较弱的 relaxed 语义,但是会在初始化完成后使用 release 语义将节点插入到 SkipList 中,即 SetNext()。根据 release 语义,之前所有 relaxed 操作在这个节点被插入到 SkipList 后对于其他线程的 acquire 操作都是可见的。
注意这里插入节点的整个过程并不是原子的,在每一层插入节点才是原子的。所以有个值得注意的点是在节点插入时我们采用从下到上的方式,因为对于 SkipList 来说,key 在 SkipList 内意味着 key 一定在 level 0,所以如果从上到下插入的话可能出现幻读,即在上层查找比较的时候存在这个 key,但是当下降到 level 0 时发现这个 key 并不存在。
除了顺序插入这个优化,在这个优化里会用 relaxed 语义进行节点读取,也就是 NoBarrier_Next() 函数,因为对于写来说,会有外部同步,所以即使前后两次插入线程不同,使用 relaxed 语义也能读到最新的节点。
PS:
RocksDB SkipList 满足线性一致性,即 Linearizability,如果你了解了线性一致性可以去看下 SkipList 的单元测试。
RocksDB 里面还有一个 SkipList,叫做 InlineSkipList,它是支持多读多写的,节点插入的时候会使用 CAS 判断节点的 next域是否发生了改变,这个 CAS 操作使用默认的 memory_order_seq_cst。
Memory Order 是每个底层程序员都需要花时间去掌握的东西,至少会让你对于并发编程的理解会更深。这里有个对于 C++ 11 memory order 的知乎回答, 讲得很简洁明了,知乎用户:如何理解 C++11 的六种 memory order?。
然后 RocksDB 也提供了一个很好的学习 memory order 的地方——SkipList,当初我看代码时直接跳过了原子操作相关的东西,因为感觉很复杂,现在看来花点时间还是能弄明白的。
另外 acquire-release 语义最近也被我放进了自己写的项目里,替代了之前的 full memory barrier,链接就不放出来了。
以下两个官方文档很适合做延伸阅读,尤其是第一个 linux kernal 文档,讲得非常详细,举了很多例子,而且还涉及了很多其他的东西,第二个文档是 C++11 memory order 的 reference。