Linux 中的“大内存页”(hugepage)是个什么?
编译自: https://kerneltalks.com/services/what-is-huge-pages-in-linux/作者: Shrikant Lavhate
译者: DarkSun
学习 Linux 中的 大内存页(hugepage)。理解什么是“大内存页”,如何进行配置,如何查看当前状态以及如何禁用它。
本文中我们会详细介绍 大内存页(huge page),让你能够回答:Linux 中的“大内存页”是什么?在 RHEL6、RHEL7、Ubuntu 等 Linux 中,如何启用/禁用“大内存页”?如何查看“大内存页”的当前值?
首先让我们从“大内存页”的基础知识开始讲起。
Linux 中的“大内存页”是个什么玩意?
“大内存页”有助于 Linux 系统进行虚拟内存管理。顾名思义,除了标准的 4KB 大小的页面外,它们还能帮助管理内存中的巨大的页面。使用“大内存页”,你最大可以定义 1GB 的页面大小。
在系统启动期间,你能用“大内存页”为应用程序预留一部分内存。这部分内存,即被“大内存页”占用的这些存储器永远不会被交换出内存。它会一直保留其中,除非你修改了配置。这会极大地提高像 Oracle 数据库这样的需要海量内存的应用程序的性能。
为什么使用“大内存页”?
在虚拟内存管理中,内核维护一个将虚拟内存地址映射到物理地址的表,对于每个页面操作,内核都需要加载相关的映射。如果你的内存页很小,那么你需要加载的页就会很多,导致内核会加载更多的映射表。而这会降低性能。
使用“大内存页”,意味着所需要的页变少了。从而大大减少由内核加载的映射表的数量。这提高了内核级别的性能最终有利于应用程序的性能。
简而言之,通过启用“大内存页”,系统具只需要处理较少的页面映射表,从而减少访问/维护它们的开销!
如何配置“大内存页”?
运行下面命令来查看当前“大内存页”的详细内容。
root@kerneltalks # grep Huge /proc/meminfoAnonHugePages: 0 kB
HugePages_Total: 0
HugePages_Free: 0
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 2048 kB
从上面输出可以看到,每个页的大小为 2MB(Hugepagesize),并且系统中目前有 0 个“大内存页”(HugePages_Total)。这里“大内存页”的大小可以从 2MB 增加到 1GB。
运行下面的脚本可以知道系统当前需要多少个巨大页。该脚本取之于 Oracle。
#!/bin/bash#
# hugepages_settings.sh
#
# Linux bash script to compute values for the
# recommended HugePages/HugeTLB configuration
#
# Note: This script does calculation for all shared memory
# segments available when the script is run, no matter it
# is an Oracle RDBMS shared memory segment or not.
# Check for the kernel version
KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`
# Find out the HugePage size
HPG_SZ=`grep Hugepagesize /proc/meminfo | awk {'print $2'}`
# Start from 1 pages to be on the safe side and guarantee 1 free HugePage
NUM_PG=1
# Cumulative number of pages required to handle the running shared memory segments
for SEG_BYTES in `ipcs -m | awk {'print $5'} | grep "[0-9][0-9]*"`
do
MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`
if [ $MIN_PG -gt 0 ]; then
NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`
fi
done
# Finish with results
case $KERN in
'2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;
echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;
'2.6' | '3.8' | '3.10' | '4.1' ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;
*) echo "Unrecognized kernel version $KERN. Exiting." ;;
esac
# End
将它以 hugepages_settings.sh 为名保存到 /tmp 中,然后运行之:
root@kerneltalks # sh /tmp/hugepages_settings.shRecommended setting: vm.nr_hugepages = 124
你的输出类似如上结果,只是数字会有一些出入。
这意味着,你系统需要 124 个每个 2MB 的“大内存页”!若你设置页面大小为 4MB,则结果就变成了 62。你明白了吧?
配置内核中的“大内存页”
本文最后一部分内容是配置上面提到的 内核参数 [1] ,然后重新加载。将下面内容添加到 /etc/sysctl.conf 中,然后输入 sysctl -p 命令重新加载配置。
vm.nr_hugepages=126注意我们这里多加了两个额外的页,因为我们希望在实际需要的页面数量之外多一些额外的空闲页。
现在,内核已经配置好了,但是要让应用能够使用这些“大内存页”还需要提高内存的使用阀值。新的内存阀值应该为 126 个页 x 每个页 2 MB = 252 MB,也就是 258048 KB。
你需要编辑 /etc/security/limits.conf 中的如下配置:
soft memlock 258048hard memlock 258048
某些情况下,这些设置是在指定应用的文件中配置的,比如 Oracle DB 就是在 /etc/security/limits.d/99-grid-oracle-limits.conf 中配置的。
这就完成了!你可能还需要重启应用来让应用来使用这些新的巨大页。
如何禁用“大内存页”?
“大内存页”默认是开启的。使用下面命令来查看“大内存页”的当前状态。
root@kerneltalks# cat /sys/kernel/mm/transparent_hugepage/enabled[always] madvise never
输出中的 [always] 标志说明系统启用了“大内存页”。
若使用的是基于 RedHat 的系统,则应该要查看的文件路径为 /sys/kernel/mm/redhat_transparent_hugepage/enabled。
若想禁用“大内存页”,则在 /etc/grub.conf 中的 kernel 行后面加上 transparent_hugepage=never,然后重启系统。
via: https://kerneltalks.com/services/what-is-huge-pages-in-linux/
作者:Shrikant Lavhate[2] 译者:lujun9972 校对:wxy
本文由 LCTT 原创编译,Linux中国 荣誉推出
点击“了解更多”可访问文内链接
相关问答
linx平方和2linx方有什么区别?2lnx和lnx²是两个函数,其中lnx=logex。2lnx的定义域是x大于0,lnx²的定义域是x不等于0,在x大于0的时候,2lnx=lnx²。自然对数以常数e为底数的对数。记作l...
Linux 是怎么读(发音)的?哪位给把音标标住出来,_作业帮[最佳回答]"Linux"这个名字我想大家现在都不会陌生了,这一年多来随着国内各种媒体的争相的宣传与报导,Linux已经成为了一个热门的话题.我想就这几个方面谈谈Li...
linux vi ^M 是什么 - MHHVOllfw 的回答 - 懂得vi是所有UNIX系统都会提供的屏幕编辑器,它提供了一个视窗设备,通过它可以编辑文件。一般情况下,windows下编辑过的文件放到Linux下行尾会多出一个^M...
linux 中nproxy是什么进程?确是一神器。(相比,它的HTTP请求的inspector功能因为各大主流浏览器都内置有这功能,反而现在用的不多)。但是,Fiddler最大的问题就是只支持Windows,这对...(...
ser2net介绍?ser2net顾名思义就是serialtonetwork的缩写,就是一个将串口数据转化成网络的软件。安装:sudoapt-getinstallser2net查看安装位置:whereis...
linux 和windows server的联系和区别 - 156****3135 的回答 -...区别在于内核2113不同,一个是windows操作系统,5261一个是linux,也就是类uinx内核。操4102作起来区1653别很大,完全是两个不同的概念,虽然都可以用于...
关于linuxshell的问题写两个函数,分别求两个整数的最大公约...[回答]#!/bin/shecho-n"inputthefirstnumber:"readmecho-n"inputthesecondnumber:"...
请教:多 LINUX 分区扩容?resize2fs/dev/vg_dc01/lv_rootxfs用以下命令来扩磁盘空间:[root@backupbinlog]#xfs_growfs/dev/mapper/centos-h...
nmom系统介绍?nmom是分析AIX和Linux性能的免费工具,帮助在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新。这个工具可以工作于任何哑屏幕、telnet会话、甚...
安装了coc.nvim之后这些命令全用不了,但是coc.nvim是显示安...安装了coc.nvim之后,cocinstall,cocinfo,cocconfig等coc命令vim都提示:E429,notaneditorcommand,而且按tab...