Disruptor (无锁并发框架)-发布

原文：http://blog.codeaholics.org/2011/the-disruptor-lock-free-publishing/

译者：罗立树

假如你生活在另外一个星球，我们最近开源了一套高性能的基于消息传递的开源框架。

下面我给大家介绍一下如何将消息通过 Ring buffer 在无锁的情况下进行处理。

在深入介绍之前，可以先快速阅读一下 Trish 发表的文章，该文章介绍了 ring buffer 和其工作原理。

这篇文章的要点如下：

1.ring buffer 是由一个大数组组成的。

2.所有 ring buffer 的“指针”（也称为序列或游标）是 java long 类型的（64位有符号数），指针采用往上计数自增的方式。（不用担心越界，即使每秒 1,000,000 条消息，也要消耗 300,000 年才可以用完）。

3.对 ring buffer 中的指针进行按 ring buffer 的 size 取模找出数组的下标来定位入口（类似于 HashMap 的 entry）。为了提高性能，我们通常将 ring buffe r的 size 大小设置成实际使用的2倍。

这样我们可以通过位运算(bit-mask )的方式计算出数组的下标。

Ring buffer 的基础结构

注意：和代码中的实际实现，我这里描述的内容是进行了简化和抽象的。从概念上讲，我认为更加方面理解。

ring buffer维护两个指针，“next”和“cursor”。

在上面的图示里，是一个 size 为 7 的 ring buffer（你应该知道这个手工绘制的图示的原理），从 0-2 的坐标位置是填充了数据的。

“next”指针指向第一个未填充数据的区块。“cursor”指针指向最后一个填充了数据的区块。在一个空闲的 ring bufer 中，它们是彼此紧邻的，如上图所示。

填充数据（Claiming a slot，获取区块）

Disruptor API 提供了事务操作的支持。当从 ring buffe r获取到区块，先是往区块中写入数据，然后再进行提交的操作。

假设有一个线程负责将字母“D”写进ring buffer中。将会从 ring buffer中获取一个区块（slot）,这个操作是一个基于CAS的“get-and-increment”操作，将“next”指针进行自增。这样，当前线程（我们可以叫做线程D）进行了 get-and-increment 操作后，

指向了位置 4，然后返回 3。这样，线程 D 就获得了位置3的操作权限。

接着，另一个线程E做类似以上的操作。

提交写入

以上，线程 D 和线程 E 都可以同时线程安全的往各自负责的区块（或位置，slots）写入数据。但是，我们可以讨论一下线程 E 先完成任务的场景…

线程E尝试提交写入数据。在一个繁忙的循环中有若干的 CAS 提交操作。线程E持有位置 4，它将会做一个 CAS 的 waiting 操作，直到 “cursor”变成 3，然后将“cursor”变成 4。

再次强调，这是一个原子性的操作。因此，现在的 ring buffer中，“cursor”现在是 2，线程E将会进入长期等待并重试操作，直到 “cursor”变成 3。

然后，线程 D 开始提交。线程 E 用 CAS 操作将“cursor”设置为 3（线程E持有的区块位置）当且仅当“cursor”位置是2.“cursor”当前是 2，所以 CAS 操作成功和提交也成功了。

这时候，“cursor”已经更新成 3，然后所有和3相关的数据变成可读。

这是一个关键点。知道 ring buffer 填充了多少 – 即写了多少数据，那一个序列数写入最高等等，是游标的一些简单的功能。“next”指针是为了保证写入的事务特性。

最后的疑惑是线程E的写入可见，线程E一直重试，尝试将“cursor”从 3 更新成 4，经过线程 D操作后已经更新成 3，那么下一次重试就可以成功了。

总结

写入数据可见的先后顺序是由线程所抢占的位置的先后顺序决定的，而不是由它的提交先后决定的。但你可以想象这些线程从网络层中获取消息，这是和消息按照时间到达的先后顺序是没什么不同的，而两个线程竞争获取一个不同循序的位置。

因此，这是一个简单而优雅的算法，写操作是原子的，事务性和无锁，即使有多个写入线程。

原创文章，转载请注明：转载自并发编程网 – ifeve.com

本文链接地址: Disruptor(无锁并发框架)-发布