经过定位发现,是centos 8内核会拒绝最后1个cpu下线请求,但是openeuler没有拒绝,所有导致所有cpu全部下线后机器重启了,这个拒绝机制开源ltp测试套也是预期拒绝的,请问openeuler是默认未开启某个编译选项才缺少这样的机制吗?
Hey @panchenbo, Welcome to openEuler Community.
All of the projects in openEuler Community are maintained by @openeuler-ci-bot.
That means the developers can comment below every pull request or issue to trigger Bot Commands.
Please follow instructions at https://gitee.com/openeuler/community/blob/master/en/sig-infrastructure/command.md to find the details.
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
CPU0 是可以 offline 的,但是我理解最后一个 cpu 是下线不了的。你的测试脚本和测试日志可以提供一下吗
CPU0 是可以 offline 的,但是我理解最后一个 cpu 是下线不了的。你的测试脚本和测试日志可以提供一下吗
github上获取ltp最新测试套(https://github.com/linux-test-project/ltp.git),执行cpuhotplug04用例应该就可以复现,必须是物理机,日志这边我暂时没有,不过之前运行出错的时候看了日志,确认过是把所有cpu都下线了,打印的日志类似下图:
@Xie XiuQi
接下串口看下重启是原因是什么吧 内核是有检查机制的 _cpu_down函数只剩一个在线CPU会返回失败的,不会继续做下线动作
我赵磊一台机器试了一下,下线最后一个 cpu 会下线失败,没有重启。
刚雄峰也看过代码了,最后一个cpu会阻止下线的。
echo 0 > /sys/devices/system/cpu/cpu0/online
-bash: echo: write error: Device or resource busy
[root@localhost tools]# cat /sys/devices/system/cpu/online
0
[root@localhost tools]# cat /sys/devices/system/cpu/offline
1-127
[root@localhost tools]# echo 0 > /sys/devices/system/cpu/cpu0/online
-bash: echo: write error: Device or resource busy
[root@localhost tools]# cat /sys/devices/system/cpu/online 0 [root@localhost tools]# cat /sys/devices/system/cpu/offline 1-127 [root@localhost tools]# echo 0 > /sys/devices/system/cpu/cpu0/online -bash: echo: write error: Device or resource busy
@Xie XiuQi 好的,我本地尝试这手动复现下
@Xie XiuQi 进一步测试发现,下线cpu确实无问题,下线后再上线会导致系统重启,操作如下图:
@Xie XiuQi 进一步测试发现,下线cpu确实无问题,下线后再上线会导致系统重启,操作如下图:
日志如下:
另,咨询下cma的这个报错是什么原因?
串口日志看下 上面截图看不到起Kdump的原因
串口日志看下 上面截图看不到起Kdump的原因
@wangxiongfeng 我这边本地没有资源能投入截取日志了,麻烦按照我的测试方法复现下,下线所有cpu,最后1个cou系统会提示下线失败,然后再上线已下线的cpu,会必现
串口日志看下 上面截图看不到起Kdump的原因
@wangxiongfeng 同时,物理机安装完报cma的错也帮忙确认下?
磁盘SAS驱动不支持中断迁移,因此不支持cpu上下线操作
#I38LRN:Taishan server 下线CPU, hisi_sas_v3_hw驱动异常
已知问题,已有其他 issue 进行跟踪。
此 issue 先关闭,如有问题,请联系 @成坚 (CHENG Jian)
登录 后才可以发表评论