cachepc-linux

Fork of AMDESE/linux with modifications for CachePC side-channel attack
git clone https://git.sinitax.com/sinitax/cachepc-linux
Log | Files | Refs | README | LICENSE | sfeed.txt

refcount-vs-atomic.rst (5337B)


      1.. include:: ../disclaimer-zh_CN.rst
      2
      3:Original: Documentation/core-api/refcount-vs-atomic.rst
      4
      5:翻译:
      6
      7 司延腾 Yanteng Si <siyanteng@loongson.cn>
      8
      9.. _cn_refcount-vs-atomic:
     10
     11=======================================
     12与atomic_t相比,refcount_t的API是这样的
     13=======================================
     14
     15.. contents:: :local:
     16
     17简介
     18====
     19
     20refcount_t API的目标是为实现对象的引用计数器提供一个最小的API。虽然来自
     21lib/refcount.c的独立于架构的通用实现在下面使用了原子操作,但一些 ``refcount_*()``
     22和 ``atomic_*()`` 函数在内存顺序保证方面有很多不同。本文档概述了这些差异,并
     23提供了相应的例子,以帮助开发者根据这些内存顺序保证的变化来验证他们的代码。
     24
     25本文档中使用的术语尽量遵循tools/memory-model/Documentation/explanation.txt
     26中定义的正式LKMM。
     27
     28memory-barriers.txt和atomic_t.txt提供了更多关于内存顺序的背景,包括通用的
     29和针对原子操作的。
     30
     31内存顺序的相关类型
     32==================
     33
     34.. note:: 下面的部分只涵盖了本文使用的与原子操作和引用计数器有关的一些内存顺
     35   序类型。如果想了解更广泛的情况,请查阅memory-barriers.txt文件。
     36
     37在没有任何内存顺序保证的情况下(即完全无序),atomics和refcounters只提供原
     38子性和程序顺序(program order, po)关系(在同一个CPU上)。它保证每个
     39``atomic_* ()`` 和 ``refcount_*()`` 操作都是原子性的,指令在单个CPU上按程序
     40顺序执行。这是用READ_ONCE()/WRITE_ONCE()和比较并交换原语实现的。
     41
     42强(完全)内存顺序保证在同一CPU上的所有较早加载和存储的指令(所有程序顺序较早
     43[po-earlier]指令)在执行任何程序顺序较后指令(po-later)之前完成。它还保证
     44同一CPU上储存的程序优先较早的指令和来自其他CPU传播的指令必须在该CPU执行任何
     45程序顺序较后指令之前传播到其他CPU(A-累积属性)。这是用smp_mb()实现的。
     46
     47RELEASE内存顺序保证了在同一CPU上所有较早加载和存储的指令(所有程序顺序较早
     48指令)在此操作前完成。它还保证同一CPU上储存的程序优先较早的指令和来自其他CPU
     49传播的指令必须在释放(release)操作之前传播到所有其他CPU(A-累积属性)。这是用
     50smp_store_release()实现的。
     51
     52ACQUIRE内存顺序保证了同一CPU上的所有后加载和存储的指令(所有程序顺序较后
     53指令)在获取(acquire)操作之后完成。它还保证在获取操作执行后,同一CPU上
     54储存的所有程序顺序较后指令必须传播到所有其他CPU。这是用
     55smp_acquire__after_ctrl_dep()实现的。
     56
     57对Refcounters的控制依赖(取决于成功)保证了如果一个对象的引用被成功获得(引用计数
     58器的增量或增加行为发生了,函数返回true),那么进一步的存储是针对这个操作的命令。对存
     59储的控制依赖没有使用任何明确的屏障来实现,而是依赖于CPU不对存储进行猜测。这只是
     60一个单一的CPU关系,对其他CPU不提供任何保证。
     61
     62
     63函数的比较
     64==========
     65
     66情况1) - 非 “读/修改/写”(RMW)操作
     67------------------------------------
     68
     69函数变化:
     70
     71 * atomic_set() --> refcount_set()
     72 * atomic_read() --> refcount_read()
     73
     74内存顺序保证变化:
     75
     76 * none (两者都是完全无序的)
     77
     78
     79情况2) - 基于增量的操作,不返回任何值
     80--------------------------------------
     81
     82函数变化:
     83
     84 * atomic_inc() --> refcount_inc()
     85 * atomic_add() --> refcount_add()
     86
     87内存顺序保证变化:
     88
     89 * none (两者都是完全无序的)
     90
     91情况3) - 基于递减的RMW操作,没有返回值
     92---------------------------------------
     93
     94函数变化:
     95
     96 * atomic_dec() --> refcount_dec()
     97
     98内存顺序保证变化:
     99
    100 * 完全无序的 --> RELEASE顺序
    101
    102
    103情况4) - 基于增量的RMW操作,返回一个值
    104---------------------------------------
    105
    106函数变化:
    107
    108 * atomic_inc_not_zero() --> refcount_inc_not_zero()
    109 * 无原子性对应函数 --> refcount_add_not_zero()
    110
    111内存顺序保证变化:
    112
    113 * 完全有序的 --> 控制依赖于存储的成功
    114
    115.. note:: 此处 **假设** 了,必要的顺序是作为获得对象指针的结果而提供的。
    116
    117
    118情况 5) - 基于Dec/Sub递减的通用RMW操作,返回一个值
    119---------------------------------------------------
    120
    121函数变化:
    122
    123 * atomic_dec_and_test() --> refcount_dec_and_test()
    124 * atomic_sub_and_test() --> refcount_sub_and_test()
    125
    126内存顺序保证变化:
    127
    128 * 完全有序的 --> RELEASE顺序 + 成功后ACQUIRE顺序
    129
    130
    131情况6)其他基于递减的RMW操作,返回一个值
    132----------------------------------------
    133
    134函数变化:
    135
    136 * 无原子性对应函数 --> refcount_dec_if_one()
    137 * ``atomic_add_unless(&var, -1, 1)`` --> ``refcount_dec_not_one(&var)``
    138
    139内存顺序保证变化:
    140
    141 * 完全有序的 --> RELEASE顺序 + 控制依赖
    142
    143.. note:: atomic_add_unless()只在执行成功时提供完整的顺序。
    144
    145
    146情况7)--基于锁的RMW
    147--------------------
    148
    149函数变化:
    150
    151 * atomic_dec_and_lock() --> refcount_dec_and_lock()
    152 * atomic_dec_and_mutex_lock() --> refcount_dec_and_mutex_lock()
    153
    154内存顺序保证变化:
    155
    156 * 完全有序 --> RELEASE顺序 + 控制依赖 + 持有