LWN:手机SoC提供商为什么要改动内核scheduler?

本文探讨了手机厂商对内核调度器所做的特定补丁,旨在提高性能和能效。通过对Pixel 4手机的测试,发现这些补丁在牺牲少量性能的同时,显著降低了功耗。

关注了就能看到更多这么棒的文章哦~

Evaluating vendor changes

By Jonathan Corbet

May 19, 2020

OSPM

原文来自:https://lwn.net/Articles/820825/

主译:DeepL

内核的CPU scheduler尽力希望能为各种类型的workload做出正确的调度决策。多年来,它已经被扩展从而能够更好地处理移动设备的进程调度工作。但手机厂商最终还是会对mainline的scheduler代码打上厂商自己特有的patch。以这种方式提供的代码并不在mainline git tree里面,内核社区不喜欢这种方式。但正如Vincent Donnefort在2020年Linux内核峰会(OSPM)上的演讲中指出的那样,这些patch的存在是有其必要性的。他检视了一些厂商的scheduler patch来调查为什么要使用这些patch。

关于这些patch的测试平台,Donnefort选择了Pixel 4手机。这是一款在upstream中拥有非常好的代码支持的设备,更换其内核很容易,不需要许多额外代码。这款设备有三种不同的CPU核心,分别是小核、中核、大核,其中小核确实计算能力非常有限。对于任何给定的任务,必须要选择使用合适的CPU,否则在性能或功耗上都不是最高效的。我们使用PCMark benchmark来评估性能,而功耗测量则是直接从手机的供电电路上进行的。测试中使用了4.14内核。

第一个用来测试的patch,通过主动将任务疏散到其他CPU来执行CPU isolation。其意图是让这个CPU能够idle下来,从而进入sleep状态。任务会被迁移走,中断也被安排到其他CPU,这个CPU就完全不在系统的多CPU负载平衡策略中考虑了。但该CPU的kernel thread仍然在运行。他说,这是一种轻量级的CPU hotplug。

这个patch的工作原理是通过查看所有运行中的task所带来的工作量,计算出需要多少CPU功耗。如果运行中的CPU数量超过了理论所需要的CPU数,那么软件就会尝试把其中一个或多个CPU给隔离出来。这个决定是在user space中做出的。

在性能测试中,Donnefort发现,CPU isolation会略微降低throughput,但也会让功耗下降4%。Vincent Guittot问道:为什么内核中内置的energy model功耗模型不能满足这个需求呢?Donnefort回答说,他没有尝试调查这个问题的其他潜在替代方案。但至少数据表明,kernel内置的energy model还是有改进的空间。

其他的patch合成了一组来介绍,包括:

  • "Migration margins":这个patch会在非对称系统上改变内核为task选择CPU的策略。这是通过比较task的预计utilization(CPU利用率)和CPU的计算能力(capacity)来实现的。mainline kernel只有在看到CPU还有至少20%的空余计算能力的情况下,才会把任务放在这个CPU上。而手机厂商的patch将这个阈值降低到5%,从而增加了把这个task最终放在更小、更节能的CPU上的几率。

  • 改变了scheduler的task packing的机制。mainline kernel会尽量将task控制在单个cluster内(从而允许其他cluster在idle),但会尽量将task分散到cluster中的各个CPU上。厂商的patch则不同,它会更努力地将task打包到单个CPU中,尽量在导致CPU的频率提升之前就停止。

  • mainline会花许多精力来寻找针对某个task最适合使用的CPU上。对一些厂商来说,这个动作花的时间有点太多,所以他们对这种算法进行了改变。改动之后,kernel会先看看上次这个task运行的位置,如果当时那个CPU是idle的,而task又适合在此CPU上执行,那么这个选择CPU的流程就会马上终止,直接选择那个CPU。他也指出,在4.14 kernel(此次测试所用的kernel版本)之后,energy-aware task placement算法也有了很大改进。

  • 在为一个实时任务选择CPU时,kernel会搜索正在运行的task拥有最低优先级的CPU,因为这是最容易被preempt(抢占)的CPU。厂商的patch则将搜索条件进行了扩展,也会考虑utilization和idle state,试图找到总体上最不繁忙的CPU。搜索的目标也是尽量偏向于在适合的CPU里面寻找最小的那个CPU。

每个patch的benchmark结果都非常相似。它们都大概会牺牲3-5%的性能,同时降低8-11%的能耗。但Donnefort没有把这些patch同时打上来进行benchmark测试,他警告说,不要想当然认为这些数据可以简单的累加起来。

最后,他给出了一个简单的结论,尽管其中的一些改动是有争议的,但在这种场景下显然是有好处的。他后面会继续研究,如何能把这些改动采用适合upstream的方式来实现。

在讨论中,Qais Youssef介绍说,他最近的一些CPU-capacity的改动也许可以替代其中的部分patch。Dietmar Eggemann提问说为什么energy model提供的CPU isolation还不够呢?它应该已经在把task尽量积极推向小核上去做。Peter Zijlstra同意这个观点,认为必须弄清楚为什么需要这种变动。也许scheduler应该在energy-ware的代码路径上更仔细地关注idle state。Donnefort说,这种形式的CPU isolation可能不是mainline kernel内核里可以接受的正确解决方案,但它确实表明了这种方式可以获得一些好处。

详细结果及更多内容请看Donnefort的幻灯片[https://lwn.net/images/conf/2020/ospm/donnefort-slides.pdf]。

全文完

LWN文章遵循CC BY-SA 4.0许可协议。

欢迎分享、转载及基于现有协议再创作~

长按下面二维码关注,关注LWN深度文章以及开源社区的各种新近言论~

【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
内容概要:本文系统介绍了基于最小势能原理(即能量法)的物理信息神经网络(PINNs)在求解固体力学二维问题中的理论框架与应用实践,并提供了完整的PyTorch代码实现案例。该方法通过将物理系统的总势能泛函嵌入神经网络的损失函数中,利用深度学习框架直接求解满足控制方程和边界条件的位移场近似解,避免了传统数值方法对网格划分的依赖。文章重点剖析了基于变分原理的能量形式如何替代强形式偏微分方程构建损失项,提升了求解的稳定性与泛化能力。同时,研究对比了不同PINNs架构与训练策略在处理复杂几何形状、非均匀材料属性及非线性力学行为时的精度、收敛性与计算效率,验证了其在处理经典弹性力学问题(如平面应力/应变问题)中的有效性与潜力。配套代码便于读者复现结果并拓展至更广泛的工程应用场景。; 适合人群:具备一定深度学习基础和固体力学知识的研究生、科研人员及工程技术从业者,特别适用于从事计算力学、智能仿真、物理驱动建模、结构分析等方向的研究者。; 使用场景及目标:①掌握基于能量法的PINNs建模范式,理解其相较于传统有限元法的优势与局限;②研究物理信息神经网络在无网格求解复杂边界与非线性问题中的能力;③对比不同神经网络结构对求解精度与收敛速度的影响,推动PINNs在工程实际中的落地应用。; 阅读建议:建议读者结合所提供的PyTorch代码逐模块分析网络构建、能量泛函定义、边界条件施加及训练流程设计,深入理解物理约束与机器学习模型的融合机制,并鼓励在自定义问题中调整网络参数、采样策略与损失权重以优化性能。
【重要提示】本资源设置为0积分下载,若非0积分请勿轻易下载 亲爱的CSDN用户: 首先感谢你点进这个资源页面。我需要提前说明一个重要情况: 本资源原本已设置为“0积分下载”,即作者希望完全免费共享。但CSDN平台有时会根据文件的下载热度、文件大小、用户权限等因素,自动将部分资源的积分调整为非0数值(如1积分、2积分、5积分等)。这是平台系统的自动行为,而非作者本人的设定。 因此,如果你当前看到该资源的下载所需积分不是0(例如显示为1、2、3……),请谨慎决定是否下载。 如果你按照非0积分支付并下载后发现资源内容不符合预期、链接失效,或者实际上该资源本应是免费的,作者无法为此承担积分损失或退还操作。强烈建议:仅在页面显示为0积分时进行下载。 另外,本资源描述中并未直接提供具体的下载地址或外部链接,因为它本身是一个通过CSDN官方上传通道提交的文件/内容包。如果你看到描述中没有外部网盘地址,这是正常的——资源文件应通过CSDN内置的“下载”按钮获取。若因平台积分显示异常导致你支付了积分,请优先联系CSDN客服咨询积分退还政策,作者没有权限修改平台自动设定的积分值。 感谢你的理解与支持。技术分享本应开放,但受限于平台规则,特此提醒如上。祝学习进步!
打开链接下载源码: https://pan.quark.cn/s/a4b39357ea24 UG(Unigraphics)作为一种在机械工程设计与制造领域内被广泛应用的计算机辅助设计与制造(CAD/CAM)软件,其功能非常全面。在UG CAM模块中,后处理步骤占据着核心地位,其作用在于将UG系统生成的刀具路径转化为特定机床能够识别的NC(数控)代码。这一过程具有高度的定制性,目的是确保生成的NC代码与特定机床控制系统的语言规范和功能特性实现精确对接。标题所提及的“UG .车床后处理”具体指向的是UG CAM系统中针对车床加工需求的后处理流程。车床主要承担旋转工件的切削任务,能够对轴类、盘类零件的内外圆柱表面、圆锥表面、螺纹以及沟槽等复杂形状进行加工。后处理的核心任务是将UG设计的3D模型和刀具路径转化为实际车床能够执行的详细指令,这些指令涵盖了进给速度、主轴转速、刀具更换机制以及冷却液控制等多个方面。描述中标注的“FANUC和GSK980TD通用”表明该后处理程序适用于两种主流的数控系统,即FANUC系统和GSK980TD系统。FANUC作为全球知名的数控系统供应商,其产品被广泛应用于各类机床设备;GSK980TD则是由中国广州数控设备有限公司研发的一款普及型数控系统,常在中小型加工中心和车床上部署使用。标签“UG车床后处理”进一步明确了讨论焦点,即探讨如何通过定制和使用UG的后处理器来满足车床的NC编程需求。压缩包中的文件列表如下: 1. GSK980TDa.def:这个文件属于后处理定义文件,其中包含了UG后处理器配置的详细参数,例如机床参数、运动类型以及代码格式等。用户可以通过编辑此文件来调整后处理输出的NC代码,使其符合GSK980TD数控系统的使用要求。 ...
代码下载地址: https://pan.quark.cn/s/a4b39357ea24 是读写权限 不是读取存储权限 视频错了 快速开始(适合 Fork) 点击右上角 Fork 本仓库到你的 账号。 打开你的仓库,进入 Actions 页面,点击 Enable workflows(启用 Actions)。 无需其他配置, 默认的 _TOKEN 权限即可推送更新。 你可以手动点击 Run workflow,也可以等待每天定时自动检查。 注意:确保你的仓库默认分支为 main,否则推送时可能失败。 如果觉得这个项目对你有帮助,欢迎顺手点个 Star 支持一下! 功能介绍 每天自动检查 bia-pain-bache/BPB-Worker-Panel 仓库的最新 Release 支持选择更新正式版或预发布版本:通过手动触发或 文件配置 1是正式版 0是测试版本。 自动下载最新版本的 worker.js 重命名为 \_worker.js 同步更新本地 version.txt 自动提交并推送到本仓库 如果 文件不存在,将自动创建并默认设置为更新正式版。 更新成功后,自动复用或创建 Issue 进行通知。 工作流程 Actions 会每日 00:00(UTC 时间)自动运行: 检查 文件:如果文件不存在,会自动创建并写入 (表示正式版)。 根据 或手动输入确定更新类型(正式版或预发布版)。 获取上游仓库的最新 Release 版本号(根据所选类型)。 比较本地 version.txt 的记录。 若版本不同,则自动下载并替换 \_worker.js。 更新 version.txt。 自动提交并推送到主分支(main)。 如果 文件是自动创建的,也会一并提交到仓库。 如果更新成功并...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值