首页 > 资讯 > 精选 >pytorch可视化之hook钩子怎么使用

189

分享到

pytorch可视化之hook钩子怎么使用

2023-07-05 15:07:51 189人浏览安东尼

摘要

这篇文章主要介绍了PyTorch可视化之hook钩子怎么使用的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇pytorch可视化之hook钩子怎么使用文章都会有所收获，下面我们一起来看看吧。一、hook在PyTo

这篇文章主要介绍了PyTorch可视化之hook钩子怎么使用的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇pytorch可视化之hook钩子怎么使用文章都会有所收获，下面我们一起来看看吧。

一、hook

在PyTorch中，提供了一个专用的接口使得网络在前向传播过程中能够获取到特征图，这个接口的名称非常形象，叫做hook。
可以想象这样的场景，数据通过网络向前传播，网络某一层我们预先设置了一个钩子，数据传播过后钩子上会留下数据在这一层的样子，读取钩子的信息就是这一层的特征图。
具体实现如下：

1.1 什么是hook，什么情况下使用？

首先，明确一下，为什么需要用hook，假设有这么一个函数

pytorch可视化之hook钩子怎么使用

需要通过梯度下降法求最小值，其实现方法如下：

import torchx = torch.tensor(3.0, requires_grad=True)y = (x-2)z = ((y-x) ** 2)z.backward()print("x.grad:",x.requires_grad,x.grad)print("y.grad:",y.requires_grad,y.grad)print("z.grad:",z.requires_grad,z.grad)

结果如下：

x.grad: True tensor(0.)
y.grad: True None
z.grad: True None

注意：在使用训练PyTorch训练模型时，只有叶节点（即直接指定数值的变量，而不是由其他变量计算得到的，比如网络输入）的梯度会保留，其余中间节点梯度在反向传播完成后就会自动释放以节省显存。因此y.requires_grad的返回值为True，y.grad却为None。

可以看到上面的requires_grad方法都显示True，但是grad没有返回值。当然pytorch也提供某种方法保留非叶子节点的梯度信息。
使用 retain_grad() 方法可以保留非叶子节点的梯度，使用 retain_grad 保留的grad会占用显存，具体操作如下：

x = torch.tensor(3.0, requires_grad=True)y = (x-2)z = ((y-x) ** 2)y.retain_grad()z.retain_grad()z.backward()print("x.grad:",x.requires_grad,x.grad)print("y.grad:",y.requires_grad,y.grad)print("z.grad:",z.requires_grad,z.grad)

out:

x.grad: True tensor(0.)y.grad: True tensor(-4.)z.grad: True tensor(1.)

** 重申一次** 使用retain_grad方法会占用显存，如果不想要占用显存，就使用到了hook方法。

对于中间节点的变量a，可以使用a.reGISter_hook(hook_fn)对其grad进行操作。而hook_fn是一个自定义的函数，其声明为hook_fn(grad) -> Tensor or None

1.2 hook在变量中的使用

1 hook的打印功能

# 自定义hook方法，其传入参数为grad，打印出使用钩子的节点梯度def hook_fn(grad):    print(grad)x = torch.tensor(3.0, requires_grad=True)y = (x-2)z = ((y-x) ** 2)y.register_hook(hook_fn)z.register_hook(hook_fn)print("backward前")z.backward()print("backward后\n")print("x.grad:",x.requires_grad,x.grad)print("y.grad:",y.requires_grad,y.grad)print("z.grad:",z.requires_grad,z.grad)

out：

backward前tensor(1.)tensor(-4.)backward后x.grad: True tensor(0.)y.grad: True Nonez.grad: True None

可以看到绑定hook后，backward打印的时候打印了y和z的梯度，调用grad的时候没有保留grad值，已经释放掉内存。注意，打印出来的结果是反向传播，所以先打印z的梯度，再打印y的梯度。

2 使用hook改变grad的功能

对标记的节点，梯度加2

def hook_fn(grad):    grad += 2    print(grad)    return gradx = torch.tensor(3.0, requires_grad=True)y = (x-2)z = ((y-x) ** 2)y.register_hook(hook_fn)z.register_hook(hook_fn)print("backward前")z.backward()print("backward后\n")print("x.grad:",x.requires_grad,x.grad)print("y.grad:",x.requires_grad,y.grad)print("z.grad:",x.requires_grad,z.grad)

out：

backward前tensor(3.)tensor(-10.)backward后x.grad: True tensor(2.)y.grad: True Nonez.grad: True None

可以看到梯度教上面的已经发生的改变。

1.3 hook在模型中的使用：

PyTorch中使用register_forward_hook和register_backward_hook获取Module输入和输出的feature_map和grad。使用结构如下： hook_fn(module, input, output) -> Tensor or None
模型中使用hook一点要带有这三个参数module, grad_input, grad_output

1 register_forward_hook的使用

import torch.nn as nndef hook_forward_fn(model,put,out):    print("model:",model)    print("input:",put)    print("output:",out)    # 定义一个modelclass Net(nn.Module):    def __init__(self):        super(Net,self).__init__()        self.conv = nn.Conv2d(3, 1, 1)        self.bn = nn.BatchNORM2d(1)        #self.conv.register_forward_hook(hook_forward_fn)        #self.bn.register_forward_hook(hook_forward_fn)    def forward(self, x):        x = self.conv(x)        x = self.bn(x)        return torch.relu(x)    net = Net()# 对模型中的具体某一层使用hooknet.conv.register_forward_hook(hook_forward_fn)net.bn.register_forward_hook(hook_forward_fn)x = torch.rand(1, 3, 2, 2, requires_grad=True)y = net(x).mean()

注意：该方法不需要使用。backWord就能输出结果，是记录前向传播的钩子。
结果如下：

model: Conv2d(3, 1, kernel_size=(1, 1), stride=(1, 1))input: (tensor([[[[0.4570, 0.6791],          [0.0197, 0.5040]],         [[0.8883, 0.1808],          [0.6289, 0.9386]],         [[0.8772, 0.5290],          [0.0014, 0.3728]]]], requires_grad=True),)output: tensor([[[[-0.4909, -0.1122],          [-0.6301, -0.5649]]]], grad_fn=<ConvolutionBackward0>)model: BatchNorm2d(1, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)input: (tensor([[[[-0.4909, -0.1122],          [-0.6301, -0.5649]]]], grad_fn=<ConvolutionBackward0>),)output: tensor([[[[-0.2060,  1.6790],          [-0.8987, -0.5743]]]], grad_fn=<NativeBatchNormBackward0>)

2 register_backward_hook的使用

使用上面相同的Net模型

def hook_backward_fn(module, grad_input, grad_output):    print(f"module: {module}")    print(f"grad_output: {grad_output}")    print(f"grad_input: {grad_input}")    print("*"*20)    net = Net()net.conv.register_backward_hook(hook_backward_fn)net.bn.register_backward_hook(hook_backward_fn)x = x = torch.rand(1, 3, 2, 2, requires_grad=True)y = net(x).mean()y.backward()

out：

module: BatchNorm2d(1, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)grad_output: (tensor([[[[0.2500, 0.2500],          [0.0000, 0.0000]]]]),)grad_input: (tensor([[[[ 0.6586, -0.3360],          [-0.3009, -0.0218]]]]), tensor([0.4575]), tensor([0.5000]))********************module: Conv2d(3, 1, kernel_size=(1, 1), stride=(1, 1))grad_output: (tensor([[[[ 0.6586, -0.3360],          [-0.3009, -0.0218]]]]),)grad_input: (tensor([[[[-0.2974,  0.1517],          [ 0.1359,  0.0098]],         [[ 0.0270, -0.0138],          [-0.0123, -0.0009]],         [[ 0.2918, -0.1489],          [-0.1333, -0.0096]]]]), tensor([[[[0.4331]],         [[0.1386]],         [[0.4292]]]]), tensor([-1.4156e-07]))********************

其结果是逆向输出各节点层的梯度信息。

3 hook中使用展示卷积层

随便画一张图，图片张这个样子：

pytorch可视化之hook钩子怎么使用

使用读取图片发现是个4通道的图像，我们转成单通道并可视化：

import matplotlib.pyplot as pltimport matplotlib.image as mpingimg=mping.imread("./test1.png")print(img.shape)img = torch.tensor(img[:,:,0]).view(1,1,228,226)plt.imshow(img[0][0])

pytorch可视化之hook钩子怎么使用

接下来创建一个只有卷积层的模型

class Net(nn.Module):    def __init__(self):        super(Net,self).__init__()        self.conv = nn.Sequential(nn.Conv2d(1,1,7),                                  nn.ReLU()                                 )    def forward(self, x):        x=self.conv(x)        return x

使用我们的钩子hook对卷积层的输出进行可视化

def hook_forward_fn(model,put,out):    print("inputshape:",put[0].shape) # 打印出输入图片的维度    print("outputshape:",out[0][0].shape) # 经过卷积之后的维度    # 可视化，因为卷积之后带有grad梯度信息，所以需要使用detach().numpy()方法，否则会报错    plt.imshow(out[0][0].detach().numpy())

具体完整实现以及可视化代码如下：

import matplotlib.pyplot as pltimport matplotlib.image as mpingimport numpy as npimg=mping.imread("./test1.png")img = torch.tensor(img[:,:,0]).view(1,1,228,226)def hook_forward_fn(model,put,out):    print("inputshape:",put[0].shape)    print("outputshape:",out[0][0].shape)    plt.imshow(out[0][0].detach().numpy())      class Net(nn.Module):    def __init__(self):        super(Net,self).__init__()        self.conv = nn.Sequential(nn.Conv2d(1,1,7),                                  nn.ReLU()                                 )    def forward(self, x):        x=self.conv(x)        return x    model = Net()model.conv.register_forward_hook(hook_forward_fn)y=model(img)

pytorch可视化之hook钩子怎么使用

关于“pytorch可视化之hook钩子怎么使用”这篇文章的内容就介绍到这里，感谢各位的阅读！相信大家对“pytorch可视化之hook钩子怎么使用”知识都有一定的了解，大家如果还想学习更多知识，欢迎关注编程网精选频道。

--结束END--

本文标题: pytorch可视化之hook钩子怎么使用

本文链接: https://lsjlt.com/news/352793.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

pytorch可视化之hook钩子怎么使用

一、hook

1.1 什么是hook，什么情况下使用？

1.2 hook在变量中的使用

1.3 hook在模型中的使用：

pytorch可视化之hook钩子怎么使用

pytorch中可视化之hook钩子

Pytorch可视化之Visdom怎么用

Pytorch可视化之Visdom使用实例

PyTorch中可视化工具的使用

PyTorch可视化工具TensorBoard和Visdom怎么用

Python数据可视化之Seaborn怎么使用

Python数据可视化之Pyecharts怎么使用

C++内联钩子怎么使用

Python可视化tkinter怎么使用

GCN 图神经网络使用详解可视化 Pytorch

Python可视化库之HoloViews的使用教程

Python数据可视化之Pyecharts使用详解

Python数据可视化之Pyecharts如何使用

Vue怎么使用echarts可视化图表

c#中怎么使用easyhook实现钩子注入

Python数据可视化之Seaborn的使用详解

使用SpringBoot怎么实现可视化监控

winform数据可视化控件怎么使用

怎么使用python的可视化工具Pandas_Alive

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南