首页 > 资讯 > 操作系统 >如何进行ARM64 Linux内核页表的块映射

440

分享到

如何进行ARM64 Linux内核页表的块映射

2023-06-15 17:06:02 440人浏览泡泡鱼

摘要

这期内容当中小编将会给大家带来有关如何进行ARM64 linux内核页表的块映射，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。内核文档Documentation/arm64/memory.rst描述了AR

这期内容当中小编将会给大家带来有关如何进行ARM64 linux内核页表的块映射，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

内核文档Documentation/arm64/memory.rst描述了ARM64 Linux内核空间的内存映射情况，应该是此方面最权威文档。

以典型的4K页和48位虚拟地址为例，整个内核空间的虚拟地址分布如下：

如何进行ARM64 Linux内核页表的块映射

从ffff000000000000到ffff7fffffffffff是一段针对物理地址的线性映射区，最大支持128TB的物理地址空间，这一段地址非常类似ARM32的low memory映射区。

我们看看这种情况下的页表，我们既可以用最终的【20:12】对应的PTE映射项，以4K为单位，进行虚拟地址到物理地址的映射;又可以以【29:21】对应的PMD映射项，以2M为单位，进行虚拟地址到物理地址的映射。

如何进行ARM64 Linux内核页表的块映射

对于用户空间的虚拟地址而言，当我们进行的是PMD映射的时候，我们得到的是Huge Page，ARM64的2MB的huge page，在虚拟和物理上都连续，它在实践工程中的好处是，可以减小TLB miss，因为，如果进行了2MB的映射，整个2MB不再需要PTE，映射关系大为减小。

如何进行ARM64 Linux内核页表的块映射

对于内核空间而言，从ffff000000000000到ffff7fffffffffff的这段虚拟地址，如果与物理地址进行的是一种PMD映射的话，显然也可以达到同样的效果。但是，这不意味着它们就是Huge Page。众所周知，内核开机把物理地址往虚拟地址进行线性映射，并不意味着这片内存被内核拿走了，它只是进行了一种映射，以便日后调用kmalloc()，get_free_pages()等api申请的内存是直接已经有虚实映射的。所以，即便内核进行的就是PMD映射，在内存的分割上，还是可以以4K为单位的：

如何进行ARM64 Linux内核页表的块映射

所以，即便我们在内核空间进行PMD映射，里面的每个蓝色圆圈(一个4K页)，还是可以被单独分配的，这种分配可以是kmalloc、vmalloc，用户态的malloc等。内核态进行的PMD映射，不意味着相关的2MB成为了huge page，它纯粹只是为了服务于当内核以线性映射的虚拟地址访问该物理地址的时候(我们认为内核大多数时候是用这个线性映射的虚拟地址的)，减小TLB miss。

当然，更牛逼的情况下，内核应该也可以直接用【38:30】位的PUD来进行映射，这样映射关系是1GB的，则整个1GB后面占TLB的时候，只需要占一个入口。

如何进行ARM64 Linux内核页表的块映射

当然，如果用户态的虚实映射是这样的，用户实际得到了一个1GB的巨页。但是对于内核的线性映射区域而言，即便我们进行了1GB的PUD映射，这1G内部就可以进一步切割为4KB页或者2MB的巨页。记住：内核态的线性映射区的映射只是个映射关系，不是个分配关系。比如下面的1GB的内核线性映射的1GB区域，仍然可以被4K分配走，或者被用户以huge page以2MB为单位分配走：

如何进行ARM64 Linux内核页表的块映射

我们需要一个真实的调试手段来验证我们的想法，这个调试手段就是PTDUMP(Page Table Dump)，相关的代码在ARM64内核的：

arch/arm64/mm/ptdump.c和ptdump_debugfs.c

我们把它们全部选中，这样我们可以得到一个debugfs接口：

/sys/kernel/debug/kernel_page_tables

来获知内核态页表的情况。

我用qemu启动了一个4GB内存的ARM64虚拟机，可以看到前1GB的虚拟地址空间大多数是PMD和PTE映射，后面的3GB，全是PUD映射：

如何进行ARM64 Linux内核页表的块映射

我的内核启动参数加了rodata=0：

$ cat /proc/cmdline root=/dev/vda2 rw console=ttyAMA0 ip=dhcp rodata=0

原因是内核在几种情况下，是不会做这种PMD和PUD映射的，相关代码见于：

如何进行ARM64 Linux内核页表的块映射

rodata_full在默认情况下总是成立的，它对应着内核的一个Config选项CONFIG_RODATA_FULL_DEFAULT_ENABLED， "Apply r/o permissions of VM areas also to their linear aliases"，这个选项提高了内核的安全性，但是减小了内核的性能。

如何进行ARM64 Linux内核页表的块映射

我在内核启动参数加的rodata=0实际上是让rodata_full为false。如果我把这个kernel启动选项去掉，我得到的内核页表是完全不一样,线性映射区也全部是PTE映射：

如何进行ARM64 Linux内核页表的块映射

最后，值得一提的是，不仅线性映射区可以使用PMD映射，vmemmap映射区也是在4K页面情况下，默认用PMD映射的：

如何进行ARM64 Linux内核页表的块映射

字节跳动的宋牧春童鞋发了一个patchset，企图在用户分得巨页的情况下，删除巨页内部的4KB的小page占用的page struct的内存消耗，这个patchset在圣诞节前目前发到了V11：

https://lore.kernel.org/linux-mm/20201222142440.28930-1-songmuchun@bytedance.com/

如何进行ARM64 Linux内核页表的块映射

在这个patchset中，它就需要拆分vmemmap的PMD映射为PTE映射:

如何进行ARM64 Linux内核页表的块映射

这个patchset的原理建立在，当内核以4KB分页的时候，每个page需要64字节的page struct。但是，当用户把它分配为巨页的时候，时候，我们不再需要一个个4KB单独用page struct描述，对于这种compound page的情况，我们应该可以把后面的page struct的内存直接释放掉，因为情况完全是雷同的，这样可以剩下不少内存。

上述就是小编为大家分享的如何进行ARM64 Linux内核页表的块映射了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注编程网操作系统频道。

--结束END--

本文标题: 如何进行ARM64 Linux内核页表的块映射

本文链接: https://lsjlt.com/news/280994.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

如何进行ARM64 Linux内核页表的块映射

如何进行ARM64 Linux内核页表的块映射

如何进行linux内核模块调试

如何进行linux-2.6内核升级

如何强制关闭linux的内核模块

linux如何罗列状态的内核模块

如何进行Linux 2.6 内核的嵌入式系统应用

Python中如何利用PyVista进行mesh的色彩映射

如何进行python核心模块中pickle和cPickle的分析

Linux内核中的数据双链表如何理解

如何进行Nginx内核优化的源代码分析

如何进行linux内存的Hugepages优化

如何进行网站的页面内链接优化

如何使用Node的内置模块zlib进行gzip压缩

如何在Linux用户空间执行内核空间的事务

如何在ArchLinux中进行内核和驱动程序的更新和管理

java 进程是如何在Linux服务器上进行内存分配的

如何显示Linux系统的内置模块和设备驱动列表

如何进行Python pandas两个表格内容模糊匹配的实现

Java数组如何在Linux和Windows中进行有效的内存管理？

如何进行mysqldump单表备份加--single-transaction --master-data=2参数执行过程的内部剖析

linux vmstat命令有哪些功能

linux转义字符使用的方法是什么

linux安装node怎么使用

如何查看Linux系统版本号

linux系统怎么配置ntp服务

win10安装报0x25D错误怎么解决

win10开机卡在用户登录界面如何解决

win10新机怎么跳过创建账户

win10中config.msi文章能不能删除

win10改为ahci后无法进入系统怎么解决