LWN:NVIDIA在追求能一次分配1GB的连续内存空间

本文围绕改善物理连续内存访问展开。指出内核开发者常避免分配大块物理连续内存,但某些场景有此需求。介绍了三种分配方法及其缺陷,还提及Yan提出减少VMA碎片化的方案,不过未获开发者认可,最终结论是目前没必要实现该机制,可改善khugepaged。
640点击上方蓝色字关注我们~



Improving access to physically contiguous memory

By Jonathan Corbet
May 8, 2019


LSFMM


一直以来,内核开发者都尽量避免分配大块的物理连续内存,因为系统运行一段时间之后内存碎片化了,就很难分配得出大块物理连续的内存空间了。不过,在2019 Linux Storage, Filesystem, and Memory-Management Summit上,Zi Yan指出,分配连续内存有时候还是必要的,如何能让这种类型的分配更容易成功呢?


Yan讲到有很多种场景里面都是需要分配物理连续内存的。如果利用huge page(2MB)或者gigantic page(1GB)的话,能够通过提高CPU TLB(translation lookaside buffer)的利用率来改善系统性能。还有一些高带宽的外设也想要用物理连续内存,这些外设也都有TLB会希望提高利用效率。每次TLB miss的时候,都需要去重新做一次page table的解析,通常外设做TLB解析的速度比起CPU更加慢得多。


目前有三种方法可以分配大块连续的物理内存。一种是通过libhugetlbfs虚拟文件系统,这种需要在Linux启动阶段就扣除这部分内存区域。用户可能拿不到最合适的size,并且在kernel里面没有API能够通过libhugetlbfs来分配内存。第二种方法是transparent huge pages(透明巨页),可是没有解决碎片化问题因此需要经常对系统内存做整理,并且它依赖于kernel的buddy allocator分配机制,也就是说能分到的最大的buffer size受MAX_ORDER(一般系统里设置为11,意味着最大就是2048个4K page)限制。这样它完全没法提供gigantic pages所需的空间。第三种方法是利用alloc_contig_range()函数,这是CMA内存分配器提供的函数,不过这个机制在user space无法使用。


Dave Hansen指出libhugetlbfs现在能在系统启动之后再进行resize了,也就是一个主要缺陷现在已经不存在了。Andrea Arcangeli认为如果能从libhugtlbfs来分配到transparent huge pages的话会非常有用,这个可能也不难实现。看起来这里真正的问题,并不是分配大块内存的能力,而是这个分配会花费多少时间。因为想要获得这种大块连续内存的话,可能总是绕不过对碎片化的内存先进行compaction。还有一些开发者争论如何才能快速分配一些更高order的内存,不过没有结论。


Mel Gorman认为大块内存分配时候的latency是一个老问题了,kernel此前在碰到这种情况的时候,可能会出现几秒钟的卡顿,不过那是很久以前的事情了。需要先有人调查清楚当前最新kernel里面是什么情况,否则我们讨论的可能只是一个假想问题。Transparent huge pages在kernel 3.0之后已经经过几次大改动了,网上搜集到的信息可能都是针对老版本的实现,不一定符合当前最新kernel的情况。所以有人如果碰到在分配大块内存的时候有长延迟的情况,应该仔细调查一下系统环境,打开tracepoints,把测试结果报告出来,当然是要用最新版本的kernel测试的情况。


不过Yan还没有讲完。他也带来了一个方案,希望能在内存被分配之后减少VMA(virtual memory area)的碎片化。希望能找到一些配对的page能够交换内容,这样来改善系统表现。这个方案跟内核的khugepaged线程还不一样,会在原地址来做defgrament,而不是分配另一个huge page来把数据搬移过去。这个page-exchange(page交换)的主意让在场的很多开发者非常惊讶,因为这个翻案可能会非常复杂。Yan认为,这种方案的优势在于它不需要再额外分配新的page,而两个互相交换内容的page会通过CPU的寄存器来做copy和交还。


Gorman问这里人们为什么需要避免分配临时page,Yan的回答是对大page来说是有价值的,不过在场的开发者没有被说服。然后Gorman问性能数据的时候,Yan回答说这个data exchange要比简单搬移两个page要快,不过不清楚为什么。Hansen问,这个改动最后到底解决了什么问题,Yan指出用这个方案,就能在不修改内核MAX_ORDER参数的情况下获得一个1GB gigantic page。与会者也没有被这个好处说服。目前的CPU对gigantic pages有tiny TLB,此前没有人提供性能数据证明用这种方案的性能优势。


Yan(他是NVIDIA员工)跟在场的另一位NVIDIA开发者讨论了一段时间,看起来NVIDIA可能希望用1GB page来在某些未来产品里面提升性能。不过他们目前目前没法提供关于这个这个未来产品的更多细节,因此kernel开发者也没有兴趣支持这个需求。


最终,这个议题结束了,Gorman的结论是目前没有必要实现这个机制,khugepaged已经足够了。如果kernel的page-migration执行的太慢了,那么大家应该想办法改善它,而不是绕过它。例如目前还没有人来帮助实现migration的批量化操作。


全文完

LWN文章遵循CC BY-SA 4.0许可协议。

极度欢迎将文章分享到朋友圈 
热烈欢迎转载以及基于现有协议上的修改再创作~


长按下面二维码关注:Linux News搬运工,希望每周的深度文章以及开源社区的各种新近言论,能够让大家满意~


640?wx_fmt=jpeg

内容概要:本文提出了一种基于非合作博弈理论的居民负荷分层调度模型,并结合双层鲸鱼优化算法(Two-level Whale Optimization Algorithm)进行高效求解,模型与算法均通过Matlab代码实现。研究针对电力系统中居民侧用电负荷的复杂调度问题,引入非合作博弈机制刻画各用户之间的利益竞争关系,实现负荷的分层优化分配;同时设计双层优化架构,上层优化资源配置,下层模拟用户自主决策行为,提升了模型的实用性与合理性。通过智能优化算法求解多层级、非凸非线性的博弈模型,有效提高了调度方案的收敛性与全局寻优能力,适用于现代智能电网中的需求侧管理与能源优化场景。; 适合人群:具备电力系统基础理论知识和Matlab编程能力,从事智能电网、能源优化调度、需求侧管理、博弈论应用等方向的科研人员、高校研究生及工程技术人员。; 使用场景及目标:①应用于居民区电力负荷的分层优化调度系统设计与仿真分析;②为非合作博弈在多主体能源系统建模中的应用提供方法论支持;③利用双层鲸鱼算法解决具有嵌套结构的复杂双层优化问题,提升求解效率与调度方案的可行性。; 阅读建议:建议读者结合提供的Matlab代码深入理解模型构建逻辑与算法实现流程,重点关注博弈模型的效用函数设计、纳什均衡求解思路以及双层优化结构的迭代机制,宜配合实际用电数据开展复现实验以验证模型有效性与鲁棒性。
内容概要:本文围绕基于自适应神经模糊推理系统(ANFIS)智能控制器的可再生能源微电网功率管理系统展开研究,结合Simulink仿真实现,深入探讨了微电网中功率的智能调控与经济机组组合调度问题。通过引入ANFIS控制器,有效应对风能、光伏等可再生能源出力的波动性与不确定性,提升系统运行的稳定性与电能质量。研究内容涵盖微电网多源协调控制策略、功率平衡管理、优化调度模型构建及仿真验证,实现了对分布式电源、储能系统和负荷的协同优化,兼顾经济性与可靠性目标,并通过仿真平台验证了所提方法的有效性与优越性。; 适合人群:具备电力系统、自动化或新能源相关专业背景,熟悉Matlab/Simulink仿真环境,从事微电网能量管理、智能控制、能源优化等领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于高比例可再生能源接入场景下的微电网能量管理系统研发与教学实践;②为实现微电网功率稳定控制与经济高效运行提供先进的智能控制解决方案;③支撑高水平学术论文复现、科研课题攻关及实际工程项目的仿真验证与方案优化。; 阅读建议:建议结合提供的Simulink模型与相关代码进行动手实践,重点关注ANFIS控制器的设计流程、规则库构建与参数调优方法,并通过与传统PID或MPC控制策略的对比实验,深入理解其在动态响应与鲁棒性方面的优势。同时可进一步拓展文中提出的优化调度逻辑,应用于多目标、多约束的复杂实际应用场景中。
内容概要:本文档聚焦于“直流电机双闭环控制Matlab仿真”,系统阐述了基于Matlab/Simulink平台实现直流电机双闭环控制系统(主要包括速度环与电流环)的设计与仿真全过程。通过构建直流电机的数学模型,结合PI控制器进行调控,实现对电机转速和电枢电流的高精度动态控制,验证控制策略的稳定性与响应性能。文档详细介绍了仿真模型的搭建流程、关键参数的整定方法、系统动态波形的分析手段以及仿真结果的有效性验证,体现了经典自动控制理论在实际电机系统中的工程应用,是电机控制与电力电子技术相结合的典型研究案例。; 适合人群:具备自动控制原理、电机与拖动基础、电力电子技术和Matlab/Simulink仿真能力的电气工程、自动化、机电一体化等专业的本科生、研究生及从事电机驱动系统研发的工程技术人员。; 使用场景及目标:①作为高校课程设计或实验教学材料,帮助学生深入理解双闭环调速系统的工作机理与工程实现;②服务于科研项目,为新型电机控制算法(如滑模、模糊PID等)的开发与性能对比提供基础仿真验证平台;③作为工业界产品前期设计的仿真工具,用于评估不同控制策略在动态响应、抗干扰能力和稳态精度方面的可行性。; 阅读建议:建议读者在学习过程中紧密结合自动控制理论知识,亲手在Simulink环境中搭建完整的双闭环仿真模型,通过反复调整PI控制器的比例与积分参数,观察并分析转速、电流的阶跃响应曲线,从而深刻理解反馈控制的本质、系统稳定性条件以及参数整定对动态性能的影响,进而掌握电机控制系统的设计精髓。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值