首页 > 资讯 > 精选 >Pytorch中net.train 和 net.eval怎么用

941

分享到

Pytorch中net.train 和 net.eval怎么用

2023-06-15 04:06:32 941人浏览薄情痞子

摘要

这篇文章主要介绍PyTorch中net.train 和 net.eval怎么用，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！在训练模型时会在前面加上：model.train()在测试模型时在前面使用：model.ev

这篇文章主要介绍PyTorch中net.train 和 net.eval怎么用，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

在训练模型时会在前面加上：

model.train()

在测试模型时在前面使用：

model.eval()

同时发现，如果不写这两个程序也可以运行，这是因为这两个方法是针对在网络训练和测试时采用不同方式的情况，比如Batch NORMalization 和 Dropout。

训练时是正对每个min-batch的，但是在测试中往往是针对单张图片，即不存在min-batch的概念。

由于网络训练完毕后参数都是固定的，因此每个批次的均值和方差都是不变的，因此直接结算所有batch的均值和方差。

所有Batch Normalization的训练和测试时的操作不同

在训练中，每个隐层的神经元先乘概率P，然后在进行激活，在测试中，所有的神经元先进行激活，然后每个隐层神经元的输出乘P。

补充：Pytorch踩坑记录——model.eval()

最近在写代码时遇到一个问题，原本训练好的模型，加载进来进行inference准确率直接掉了5个点，尼玛，这简直不能忍啊～本菜鸡下意识地感知到我肯定又在哪里写了bug了～～～于是开始到处排查，从model load到data load，最终在一个被我封装好的module的犄角旮旯里找到了问题，于是顺便就在这里总结一下，避免以后再犯。

对于训练好的模型加载进来准确率和原先的不符，比较常见的有两方面的原因：

1）data

2）model.state_dict()

1） data

数据方面，检查前后两次加载的data有没有发生变化。首先检查 transforms.Normalize 使用的均值和方差是否和训练时相同；另外检查在这个过程中数据是否经过了存储形式的改变，这有可能会带来数据精度的变化导致一定的信息丢失。

比如我过用的其中一个数据集，原先将图片存储成向量形式，但其对应的是“png”格式的数据（后来在原始文件中发现了相应的描述。），而我进行了一次data-to-img操作，将向量转换成了“jpg”形式，这时加载进来便造成了掉点。

2）model.state_dict()

第一方面造成的掉点一般不会太严重，第二方面造成的掉点就比较严重了，一旦模型的参数加载错了，那就误差大了。

如果是参数没有正确加载进来则比较容易发现，这时准确率非常低，几乎等于瞎猜。

而我这次遇到的情况是，准确率并不是特别低，只掉了几个点，检查了多次，均显示模型参数已经成功加载了。后来仔细查看后发现在其中一次调用模型进行inference时，忘了写 ‘model.eval()'，造成了模型的参数发生变化，再次调用则出现了掉点。

于是又回顾了一下model.eval()和model.train()的具体作用。如下：

model.train() 和 model.eval() 一般在模型训练和评价的时候会加上这两句，主要是针对由于model 在训练时和评价时 Batch

Normalization 和 Dropout 方法模式不同：

a) model.eval()，不启用 BatchNormalization 和 Dropout。此时pytorch会自动把BN和DropOut固定住，不会取平均，而是用训练好的值。不然的话，一旦test的batch_size过小，很容易就会因BN层导致模型performance损失较大；

b) model.train() ：启用 BatchNormalization 和 Dropout。在模型测试阶段使用model.train() 让model变成训练模式，此时 dropout和batch normalization的操作在训练q起到防止网络过拟合的问题。

因此，在使用PyTorch进行训练和测试时一定要记得把实例化的model指定train/eval。

model.eval()   vs   torch.no_grad()

虽然二者都是eval的时候使用，但其作用并不相同:

model.eval() 负责改变batchnorm、dropout的工作方式，如在eval()模式下，dropout是不工作的。见下方代码：

  import torch  import torch.nn as nn   drop = nn.Dropout()  x = torch.ones(10)    # Train mode     drop.train()  print(drop(x)) # tensor([2., 2., 0., 2., 2., 2., 2., 0., 0., 2.])       # Eval mode     drop.eval()  print(drop(x)) # tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

torch.no_grad() 负责关掉梯度计算，节省eval的时间。

只进行inference时，model.eval()是必须使用的，否则会影响结果准确性。而torch.no_grad()并不是强制的，只影响运行效率。

pytorch的优点

1.PyTorch是相当简洁且高效快速的框架；2.设计追求最少的封装；3.设计符合人类思维，它让用户尽可能地专注于实现自己的想法；4.与Google的Tensorflow类似，FAIR的支持足以确保PyTorch获得持续的开发更新；5.PyTorch作者亲自维护的论坛供用户交流和求教问题6.入门简单

以上是“Pytorch中net.train 和 net.eval怎么用”这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注编程网精选频道！

--结束END--

本文标题: Pytorch中net.train 和 net.eval怎么用

本文链接: https://lsjlt.com/news/277620.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Pytorch中net.train 和 net.eval怎么用

在训练模型时会在前面加上：

在测试模型时在前面使用：

对于训练好的模型加载进来准确率和原先的不符，比较常见的有两方面的原因：

1） data

2）model.state_dict()

Normalization 和 Dropout 方法模式不同：

pytorch的优点

Pytorch中net.train 和 net.eval怎么用

Pytorch 中net.train 和 net.eval的使用说明

Pytorch中torch.flatten()和torch.nn.Flatten()怎么用

BCELoss和BCEWithLogitsLoss怎么在Pytorch中使用

Pytorch中的model.train()和model.eval()怎么使用

ubuntu中pytorch怎么安装和使用

PyTorch中的train()、eval()和no_grad()怎么使用

Pytorch中BertModel怎么用

pytorch中model=model.to怎么用

Python中Pytorch怎么使用

pytorch中nn.Dropout怎么使用

pytorch中[..., 0]怎么使用

PyTorch中的torch.cat怎么用

Pytorch中怎么使用TensorBoard

PyTorch中torch.utils.data.DataLoader怎么使用

pytorch中nn.RNN()怎么使用

怎么用pytorch 计算Parameter和FLOP

怎么在Pytorch中切换 cpu和gpu

pytorch中的transforms.ToTensor和transforms.Normalize怎么实现

pytorch中with torch.no_grad()怎么使用

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南