首页 > 资讯 > 精选 >alexnet网络结构指的是什么

618

分享到

alexnet网络结构指的是什么

2023-06-20 13:06:54 618人浏览八月长安

摘要

小编给大家分享一下alexnet网络结构指的是什么，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！第一层卷积层1，卷积核的数量为96；第二层卷积层2，卷积的个数为2

小编给大家分享一下alexnet网络结构指的是什么，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

第一层卷积层1，卷积核的数量为96；第二层卷积层2，卷积的个数为256个；第三层卷积3, 输入为第二层的输出，卷积核个数为384；第四层卷积4，输入为第三层的输出，卷积核个数为384；第五层卷积5, 输入为第四层的输出，卷积核个数为256。

本教程操作环境：windows7系统、Dell G3电脑。

AlexNet网络，是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。在那年之后，更多的更深的神经网路被提出，比如优秀的vgg,GoogleLeNet。其官方提供的数据模型，准确率达到57.1%,top 1-5 达到80.2%. 这项对于传统的机器学习分类算法而言，已经相当的出色.

alexnet网络结构指的是什么

网络结构解析

alexnet网络结构指的是什么

上图所示是caffe中alexnet的网络结构，采用是两台GPU服务器，所有会看到两个流程图。AlexNet的网络模型解读如下表：

alexnet网络结构指的是什么

解读如下:

第一层：卷积层1，输入为 224×224×3 224 \times 224 \times 3224×224×3的图像，卷积核的数量为96，论文中两片GPU分别计算48个核; 卷积核的大小为 11×11×3 11 \times 11 \times 311×11×3; stride = 4, stride表示的是步长， pad = 0, 表示不扩充边缘;卷积后的图形大小是怎样的呢？wide = (224 + 2 * padding - kernel_size) / stride + 1 = 54height = (224 + 2 * padding - kernel_size) / stride + 1 = 54dimention = 96然后进行 (Local Response NORMalized), 后面跟着池化pool_size = (3, 3), stride = 2, pad = 0 最终获得第一层卷积的feature map最终第一层卷积的输出为第二层：卷积层2, 输入为上一层卷积的feature map， 卷积的个数为256个，论文中的两个GPU分别有128个卷积核。卷积核的大小为：5×5×48 5 \times 5 \times 485×5×48; pad = 2, stride = 1; 然后做 LRN， 最后 max_pooling, pool_size = (3, 3), stride = 2;第三层：卷积3, 输入为第二层的输出，卷积核个数为384, kernel_size = (3×3×256 3 \times 3 \times 2563×3×256)， padding = 1, 第三层没有做LRN和Pool第四层：卷积4, 输入为第三层的输出，卷积核个数为384, kernel_size = (3×3 3 \times 33×3), padding = 1, 和第三层一样，没有LRN和Pool第五层：卷积5, 输入为第四层的输出，卷积核个数为256, kernel_size = (3×3 3 \times 33×3), padding = 1。然后直接进行max_pooling, pool_size = (3, 3), stride = 2;第6,7,8层是全连接层，每一层的神经元的个数为4096，最终输出softmax为1000,因为上面介绍过，ImageNet这个比赛的分类个数为1000。全连接层中使用了RELU和Dropout。

用caffe 自带的绘图工具(caffe/python/draw_net.py) 和caffe/models/bvlc_alexnet/目录下面的train_val.prototxt绘制的网络结构图如下图:

python3 draw_net.py --rankdir TB ../models/bvlc_alexnet/train_val.prototxt AlexNet_structure.jpg

alexnet网络结构指的是什么

算法创新点

（1）成功使用ReLU作为CNN的激活函数，并验证其效果在较深的网络超过了Sigmoid，成功解决了Sigmoid在网络较深时的梯度弥散问题。虽然ReLU激活函数在很久之前就被提出了，但是直到AlexNet的出现才将其发扬光大。

（2）训练时使用Dropout随机忽略一部分神经元，以避免模型过拟合。Dropout虽有单独的论文论述，但是AlexNet将其实用化，通过实践证实了它的效果。在AlexNet中主要是最后几个全连接层使用了Dropout。

（3）在CNN中使用重叠的最大池化。此前CNN中普遍使用平均池化，AlexNet全部使用最大池化，避免平均池化的模糊化效果。并且AlexNet中提出让步长比池化核的尺寸小，这样池化层的输出之间会有重叠和覆盖，提升了特征的丰富性。

（4）提出了LRN层，对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。

（5）多GPU训练,可以增大网络训练规模.

（6）百万级ImageNet数据图像输入.在AlexNet用到的Data Augmentation方式有三种:

平移变换(crop);

反射变换(flip);

光照和彩色变换(color jittering):先对图片进行随机平移,然后水平翻转.测试时,先对左上,右上,左下,右下和中间做5次平移变换,然后翻转之后对结果求平均.

归纳总结为：

使用ReLU激活函数；
提出Dropout防止过拟合；
使用数据扩充增强数据集(Data augmentation)；

水平翻转图像、随机裁剪、平移变换、颜色变换、光照变换等

使用多GPU进行训练；

将上层的结果按照通道维度拆分为2份，分别送入2个GPU，如上一层输出的27×27×96的像素层（被分成两组27×27×48的像素层放在两个不同GPU中进行运算）；

LRN局部归一化的使用；
使用重叠池化(3*3的池化核)。

Caffe框架下训练

准备数据集，修改Alexnet网络的train.prototxt，配置solver，deploy.prototxt文件，新建train.sh脚本，即可开始训练。

以上是“alexnet网络结构指的是什么”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注编程网精选频道！

--结束END--

本文标题: alexnet网络结构指的是什么

本文链接: https://lsjlt.com/news/296917.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

alexnet网络结构指的是什么

alexnet网络结构指的是什么

计算机网络的拓扑结构是什么

MXNet之网络结构搭建的方法是什么

pytorch网络结构可视化的方法是什么

网络云指的是什么

Internet四层结构指的是什么

服务器7层网络结构模型是什么

python网络爬虫指的是什么

go语言结构体指的是什么

计算机网络中系统可靠性最高的网络拓扑结构是什么

网络上js指的是什么意思

4g lte网络指的是什么意思

网络词null指的是什么意思

网络爬虫python指的是什么意思

亚马逊的网络服务器结构包括什么

Composer的结构是什么

互联网中自动驾驶网络指的是什么

互联网中网络钓鱼指的是什么意思

网络层中互联设备指的是什么

网络编程中python指的是什么意思

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南