返回顶部
首页 > 资讯 > 后端开发 > Python >模型训练时GPU利用率太低的原因及解决
  • 350
分享到

模型训练时GPU利用率太低的原因及解决

模型训练GPU利用率太低模型训练GPU利用率低 2023-02-22 09:02:33 350人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

目录模型训练时GPU利用率太低的原因问题的解决办法模型训练GPU利用率低,占用低怎么破GPU 显存占用低问题GPU利用率低问题总结模型训练时GPU利用率太低的原因 最近在训练SSD模

模型训练时GPU利用率太低的原因

最近在训练SSD模型时发现GPU的利用率只有8%,而CPU的利用率却非常高。

后来了解到,一般使用CPU进行数据的读取和预处理,而使用GPU进行模型的正向传播和反向传播。由于CPU数据读取跟不上(读到内存+多线程+二进制文件),而GPU的处理速度太快,导致GPU的利用率不高。

最后总结一下,有的时候模型训练慢并不是因为显卡不行或者模型太大,而是在跑模型过程中有一些其他的操作导致速度很慢,尤其是文件的io操作,这会导致GPU得不到连续性使用,整体速度特别慢。

问题的解决办法

1,关闭一些日志记录,减少日志IO操作频率。

2,NVIDA提供了DALI库,可以将数据处理转移到GPU上。

模型训练GPU利用率低,占用低怎么破

GPU 的显存占用和算力利用直接影响模型的训练速度

GPU 显存占用低问题

1、提高batch_size

2、提高模型输入尺寸

3、增加模型深度

推荐:优先提高batch_size, 其他方法会对模型结构产生影响

GPU利用率低问题

1、提高线程

2、打开pin_memory

# 在PyTorch 加载数据时提高线程数,打开pin_memory
torch.utils.data.DataLoader(image_datasets[x],
                            batch_size=batch_size, 
                            shuffle=True,
                            num_workers=8,
                            pin_memory=True)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

--结束END--

本文标题: 模型训练时GPU利用率太低的原因及解决

本文链接: https://lsjlt.com/news/197054.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作