402 Star 1.4K Fork 1.3K

GVPopenEuler / kernel

 / 详情

大模型GPT2在单卡超分训练场景下,batch_size=2时GMEM性能提升较Nvidia UVM不足60%

已验收
缺陷
创建于  
2023-09-18 15:20

【环境信息】
6.4.0-8.0.0.16.oe2309.aarch64
【问题复现步骤】,请描述具体的操作步骤
batch_size=2,训练gpt2
【实际结果】,请描述出问题的结果和影响
GMEM性能提升较Nvidia UVM不足60%
【其他相关附件信息】

评论 (2)

zhangxiaofeng_melody 创建了缺陷

Hi zhangxiaofeng-melody, welcome to the openEuler Community.
I'm the Bot here serving you. You can find the instructions on how to interact with me at Here.
If you have any questions, please contact the SIG: Kernel, and any of the maintainers.

openeuler-ci-bot 添加了
 
sig/Kernel
标签
zhangxiaofeng_melody 负责人设置为Fcc
zhangxiaofeng_melody 优先级设置为主要

1.3B模型,图单算子模式batch_size=2时未超分,性能符合预期

zhangxiaofeng_melody 任务状态待办的 修改为已验收

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(3)
5329419 openeuler ci bot 1632792936 7956412 yang yanchao 1692438383
C
1
https://gitee.com/openeuler/kernel.git
git@gitee.com:openeuler/kernel.git
openeuler
kernel
kernel

搜索帮助