首页 > 资讯 > 精选 >pytorch DataLoader的num_workers参数与设置大小的示例分析

689

分享到

pytorch DataLoader的num_workers参数与设置大小的示例分析

2023-06-15 07:06:44 689人浏览泡泡鱼

摘要

这篇文章主要介绍PyTorch DataLoader的num_workers参数与设置大小的示例分析，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！Q：在给Dataloader设置worker数量（num_worker

这篇文章主要介绍PyTorch DataLoader的num_workers参数与设置大小的示例分析，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

Q：在给Dataloader设置worker数量（num_worker）时，到底设置多少合适？这个worker到底怎么工作的？

train_loader = torch.utils.data.DataLoader(train_dataset,                                               batch_size=batch_size, shuffle=True,                                               num_workers=4)

参数详解：

每次dataloader加载数据时：dataloader一次性创建num_worker个worker，（也可以说dataloader一次性创建num_worker个工作进程，worker也是普通的工作进程），并用batch_sampler将指定batch分配给指定worker，worker将它负责的batch加载进RAM。

然后，dataloader从RAM中找本轮迭代要用的batch，如果找到了，就使用。如果没找到，就要num_worker个worker继续加载batch到内存，直到dataloader在RAM中找到目标batch。一般情况下都是能找到的，因为batch_sampler指定batch时当然优先指定本轮要用的batch。

num_worker设置得大，好处是寻batch速度快，因为下一轮迭代的batch很可能在上一轮/上上一轮...迭代时已经加载好了。坏处是内存开销大，也加重了CPU负担（worker加载数据到RAM的进程是CPU复制的嘛）。num_workers的经验设置值是自己电脑/服务器的CPU核心数，如果CPU很强、RAM也很充足，就可以设置得更大些。

如果num_worker设为0，意味着每一轮迭代时，dataloader不再有自主加载数据到RAM这一步骤（因为没有worker了），而是在RAM中找batch，找不到时再加载相应的batch。缺点当然是速度更慢。

设置大小建议：

Dataloader的num_worker设置多少才合适，这个问题是很难有一个推荐的值。有以下几个建议：

num_workers=0表示只有主进程去加载batch数据，这个可能会是一个瓶颈。

num_workers = 1表示只有一个worker进程用来加载batch数据，而主进程是不参与数据加载的。这样速度也会很慢。

num_workers>0 表示只有指定数量的worker进程去加载数据，主进程不参与。增加num_works也同时会增加cpu内存的消耗。所以num_workers的值依赖于 batch size和机器性能。

一般开始是将num_workers设置为等于计算机上的CPU数量

最好的办法是缓慢增加num_workers，直到训练速度不再提高，就停止增加num_workers的值。

补充：pytorch中Dataloader()中的num_workers设置问题

如果num_workers的值大于0，要在运行的部分放进__main__()函数里，才不会有错：

import numpy as npimport torchfrom torch.autograd import Variableimport torch.nn.functionalimport matplotlib.pyplot as pltimport torch.utils.data as Data  BATCH_SIZE=5 x=torch.linspace(1,10,10)y=torch.linspace(10,1,10)torch_dataset=Data.TensorDataset(x,y)loader=Data.DataLoader(    dataset=torch_dataset,    batch_size=BATCH_SIZE,    shuffle=True,    num_workers=2,)  def main():    for epoch in range(3):        for step,(batch_x,batch_y) in enumerate(loader):            # training....            print('Epoch:',epoch,'| step:',step,'| batch x:',batch_x.numpy(),                  '| batch y:',batch_y.numpy())  if __name__=="__main__":    main()  '''# 下面这样直接运行会报错： for epoch in range(3):     for step,(batch_x,batch_y) in enumerate(loader):         # training....          print('Epoch:',epoch,'| step:',step,'| batch x:',batch_x.numpy(),                  '| batch y:',batch_y.numpy()'''

pytorch的优点

1.PyTorch是相当简洁且高效快速的框架；2.设计追求最少的封装；3.设计符合人类思维，它让用户尽可能地专注于实现自己的想法；4.与Google的Tensorflow类似，FAIR的支持足以确保PyTorch获得持续的开发更新；5.PyTorch作者亲自维护的论坛供用户交流和求教问题6.入门简单

以上是“pytorch DataLoader的num_workers参数与设置大小的示例分析”这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注编程网精选频道！

--结束END--

本文标题: pytorch DataLoader的num_workers参数与设置大小的示例分析

本文链接: https://lsjlt.com/news/278412.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

pytorch DataLoader的num_workers参数与设置大小的示例分析

参数详解：

设置大小建议：

pytorch的优点

pytorch DataLoader的num_workers参数与设置大小的示例分析

pytorch DataLoader的num_workers参数与设置大小详解

PyTorch dataloader中shuffle=True的示例分析

JVM参数设置的示例分析

Elasticsearch参数配置的示例分析

SpringBoot文件上传大小设置方式的示例分析

mysql参数的示例分析

pip参数的示例分析

sendEmail-参数的示例分析

函数参数的示例分析

Python中float()函数的参数分析与示例演示

SpringBoot随机数设置及参数间引用的示例分析

SpringBoot与SpringMVC中参数传递的示例分析

MySQL中query_cache_type参数与使用的示例分析

mySQL表单大小的示例分析

Spring Boot jar启动时设置环境参数的示例分析

JS中函数参数传递与同名参数的示例分析

Redhat配置nagios参数说明的示例分析

MongoDB中参数限制与阀值的示例分析

安装ORACLE时在Linux上设置内核参数的示例分析

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南