cachepc-linux

Fork of AMDESE/linux with modifications for CachePC side-channel attack
git clone https://git.sinitax.com/sinitax/cachepc-linux
Log | Files | Refs | README | LICENSE | sfeed.txt

reclaim.rst (8332B)


      1.. SPDX-License-Identifier: GPL-2.0
      2.. include:: ../../../disclaimer-zh_CN.rst
      3
      4:Original: Documentation/admin-guide/mm/damon/reclaim.rst
      5
      6:翻译:
      7
      8 司延腾 Yanteng Si <siyanteng@loongson.cn>
      9
     10:校译:
     11
     12===============
     13基于DAMON的回收
     14===============
     15
     16基于DAMON的回收(DAMON_RECLAIM)是一个静态的内核模块,旨在用于轻度内存压力下的主动和轻
     17量级的回收。它的目的不是取代基于LRU列表的页面回收,而是有选择地用于不同程度的内存压力和要
     18求。
     19
     20哪些地方需要主动回收?
     21======================
     22
     23在一般的内存超量使用(over-committed systems,虚拟化相关术语)的系统上,主动回收冷页
     24有助于节省内存和减少延迟高峰,这些延迟是由直接回收进程或kswapd的CPU消耗引起的,同时只产
     25生最小的性能下降 [1]_ [2]_ 。
     26
     27基于空闲页报告 [3]_ 的内存过度承诺的虚拟化系统就是很好的例子。在这样的系统中,客户机
     28向主机报告他们的空闲内存,而主机则将报告的内存重新分配给其他客户。因此,系统的内存得到了充
     29分的利用。然而,客户可能不那么节省内存,主要是因为一些内核子系统和用户空间应用程序被设计为
     30使用尽可能多的内存。然后,客户机可能只向主机报告少量的内存是空闲的,导致系统的内存利用率下降。
     31在客户中运行主动回收可以缓解这个问题。
     32
     33它是如何工作的?
     34================
     35
     36DAMON_RECLAIM找到在特定时间内没有被访问的内存区域并分页。为了避免它在分页操作中消耗过多
     37的CPU,可以配置一个速度限制。在这个速度限制下,它首先分页出那些没有被访问过的内存区域。系
     38统管理员还可以配置在什么情况下这个方案应该自动激活和停用三个内存压力水位。
     39
     40接口: 模块参数
     41==============
     42
     43要使用这个功能,你首先要确保你的系统运行在一个以 ``CONFIG_DAMON_RECLAIM=y`` 构建的内
     44核上。
     45
     46为了让系统管理员启用或禁用它,并为给定的系统进行调整,DAMON_RECLAIM利用了模块参数。也就
     47是说,你可以把 ``damon_reclaim.<parameter>=<value>`` 放在内核启动命令行上,或者把
     48适当的值写入 ``/sys/modules/damon_reclaim/parameters/<parameter>`` 文件。
     49
     50注意,除 ``启用`` 外的参数值只在DAMON_RECLAIM启动时应用。因此,如果你想在运行时应用新
     51的参数值,而DAMON_RECLAIM已经被启用,你应该通过 ``启用`` 的参数文件禁用和重新启用它。
     52在重新启用之前,应将新的参数值写入适当的参数值中。
     53
     54下面是每个参数的描述。
     55
     56enabled
     57-------
     58
     59启用或禁用DAMON_RECLAIM。
     60
     61你可以通过把这个参数的值设置为 ``Y`` 来启用DAMON_RCLAIM,把它设置为 ``N`` 可以禁用
     62DAMON_RECLAIM。注意,由于基于水位的激活条件,DAMON_RECLAIM不能进行真正的监测和回收。
     63这一点请参考下面关于水位参数的描述。
     64
     65min_age
     66-------
     67
     68识别冷内存区域的时间阈值,单位是微秒。
     69
     70如果一个内存区域在这个时间或更长的时间内没有被访问,DAMON_RECLAIM会将该区域识别为冷的,
     71并回收它。
     72
     73默认为120秒。
     74
     75quota_ms
     76--------
     77
     78回收的时间限制,以毫秒为单位。
     79
     80DAMON_RECLAIM 试图在一个时间窗口(quota_reset_interval_ms)内只使用到这个时间,以
     81尝试回收冷页。这可以用来限制DAMON_RECLAIM的CPU消耗。如果该值为零,则该限制被禁用。
     82
     83默认为10ms。
     84
     85quota_sz
     86--------
     87
     88回收的内存大小限制,单位为字节。
     89
     90DAMON_RECLAIM 收取在一个时间窗口(quota_reset_interval_ms)内试图回收的内存量,并
     91使其不超过这个限制。这可以用来限制CPU和IO的消耗。如果该值为零,则限制被禁用。
     92
     93默认情况下是128 MiB。
     94
     95quota_reset_interval_ms
     96-----------------------
     97
     98时间/大小配额收取重置间隔,单位为毫秒。
     99
    100时间(quota_ms)和大小(quota_sz)的配额的目标重置间隔。也就是说,DAMON_RECLAIM在
    101尝试回收‘不’超过quota_ms毫秒或quota_sz字节的内存。
    102
    103默认为1秒。
    104
    105wmarks_interval
    106---------------
    107
    108当DAMON_RECLAIM被启用但由于其水位规则而不活跃时,在检查水位之前的最小等待时间。
    109
    110wmarks_high
    111-----------
    112
    113高水位的可用内存率(每千字节)。
    114
    115如果系统的可用内存(以每千字节为单位)高于这个数值,DAMON_RECLAIM就会变得不活跃,所以
    116它什么也不做,只是定期检查水位。
    117
    118wmarks_mid
    119----------
    120
    121中间水位的可用内存率(每千字节)。
    122
    123如果系统的空闲内存(以每千字节为单位)在这个和低水位线之间,DAMON_RECLAIM就会被激活,
    124因此开始监测和回收。
    125
    126wmarks_low
    127----------
    128
    129低水位的可用内存率(每千字节)。
    130
    131如果系统的空闲内存(以每千字节为单位)低于这个数值,DAMON_RECLAIM就会变得不活跃,所以
    132它除了定期检查水位外什么都不做。在这种情况下,系统会退回到基于LRU列表的页面粒度回收逻辑。
    133
    134sample_interval
    135---------------
    136
    137监测的采样间隔,单位是微秒。
    138
    139DAMON用于监测冷内存的采样间隔。更多细节请参考DAMON文档 (:doc:`usage`) 。
    140
    141aggr_interval
    142-------------
    143
    144监测的聚集间隔,单位是微秒。
    145
    146DAMON对冷内存监测的聚集间隔。更多细节请参考DAMON文档 (:doc:`usage`)。
    147
    148min_nr_regions
    149--------------
    150
    151监测区域的最小数量。
    152
    153DAMON用于冷内存监测的最小监测区域数。这可以用来设置监测质量的下限。但是,设
    154置的太高可能会导致监测开销的增加。更多细节请参考DAMON文档 (:doc:`usage`) 。
    155
    156max_nr_regions
    157--------------
    158
    159监测区域的最大数量。
    160
    161DAMON用于冷内存监测的最大监测区域数。这可以用来设置监测开销的上限值。但是,
    162设置得太低可能会导致监测质量不好。更多细节请参考DAMON文档 (:doc:`usage`) 。
    163
    164monitor_region_start
    165--------------------
    166
    167目标内存区域的物理地址起点。
    168
    169DAMON_RECLAIM将对其进行工作的内存区域的起始物理地址。也就是说,DAMON_RECLAIM
    170将在这个区域中找到冷的内存区域并进行回收。默认情况下,该区域使用最大系统内存区。
    171
    172monitor_region_end
    173------------------
    174
    175目标内存区域的结束物理地址。
    176
    177DAMON_RECLAIM将对其进行工作的内存区域的末端物理地址。也就是说,DAMON_RECLAIM将
    178在这个区域内找到冷的内存区域并进行回收。默认情况下,该区域使用最大系统内存区。
    179
    180kdamond_pid
    181-----------
    182
    183DAMON线程的PID。
    184
    185如果DAMON_RECLAIM被启用,这将成为工作线程的PID。否则,为-1。
    186
    187nr_reclaim_tried_regions
    188------------------------
    189
    190试图通过DAMON_RECLAIM回收的内存区域的数量。
    191
    192bytes_reclaim_tried_regions
    193---------------------------
    194
    195试图通过DAMON_RECLAIM回收的内存区域的总字节数。
    196
    197nr_reclaimed_regions
    198--------------------
    199
    200通过DAMON_RECLAIM成功回收的内存区域的数量。
    201
    202bytes_reclaimed_regions
    203-----------------------
    204
    205通过DAMON_RECLAIM成功回收的内存区域的总字节数。
    206
    207nr_quota_exceeds
    208----------------
    209
    210超过时间/空间配额限制的次数。
    211
    212例子
    213====
    214
    215下面的运行示例命令使DAMON_RECLAIM找到30秒或更长时间没有访问的内存区域并“回收”?
    216为了避免DAMON_RECLAIM在分页操作中消耗过多的CPU时间,回收被限制在每秒1GiB以内。
    217它还要求DAMON_RECLAIM在系统的可用内存率超过50%时不做任何事情,但如果它低于40%时
    218就开始真正的工作。如果DAMON_RECLAIM没有取得进展,因此空闲内存率低于20%,它会要求
    219DAMON_RECLAIM再次什么都不做,这样我们就可以退回到基于LRU列表的页面粒度回收了::
    220
    221    # cd /sys/modules/damon_reclaim/parameters
    222    # echo 30000000 > min_age
    223    # echo $((1 * 1024 * 1024 * 1024)) > quota_sz
    224    # echo 1000 > quota_reset_interval_ms
    225    # echo 500 > wmarks_high
    226    # echo 400 > wmarks_mid
    227    # echo 200 > wmarks_low
    228    # echo Y > enabled
    229
    230.. [1] https://research.google/pubs/pub48551/
    231.. [2] https://lwn.net/Articles/787611/
    232.. [3] https://www.kernel.org/doc/html/latest/vm/free_page_reporting.html