当前位置：移动技术网 > IT编程>开发语言>Java > 【深度学习笔记（五）】之卷积神经网络组成介绍

【深度学习笔记（五）】之卷积神经网络组成介绍

2020年07月20日 | 移动技术网IT编程 | 我要评论

一. 卷积神经网络（CNN）

（一）结构组成

经典的神经网络我们之间已经讲过了，现在我们要讲的是卷积神经网络。

神经网络的结构是：

输入层 + 隐藏层 + 激活函数 + 输出层

卷积神经网络的组成：

输入层 + 卷积层 + 激活函数 + 池化层 + 全连接层
INPUT + CONV + RELU + POOL + FC

（二）卷积层：

所谓的卷积类似于图像空间域处理的卷积操作，设置一个小区域的滤波器，将输入的图像按照滤波器的大小来分区域，然后将滤波器在输入图像的每一个区域上滑动，对于每一个区域都产生一个特征值。

当滤波器把输入图像的所有区域求取了特征值后，就生成了一个特征图。该特征图中存储的就是滤波器在输入图像上产生的每一个特征值。

可以看到，卷积时边缘信息利用是较少的。为了将这些边缘信息利用起来，在原始输入图像中加上一圈边缘0，记作(+pad 1)，添加了n层0，记为+pad n。原始图像的边缘现在就不是边缘了，同时，现在的边缘全为0，这些0对于特征值的提取没有意义，因此就算添加了一圈0也没有影响，它们的存在只是为了让原来的图像边缘有更多被计算的机会。

（三）卷积输出特征图尺寸

该特征图的大小尺寸，是由输入图像的尺寸大小Input，滤波器的尺寸大小Filter，卷积的步长stride以及填充0的宽度pad来决定的。

Output =( Input + 2 * Pad ) / stride + 1

Output即为卷积输出的结果尺寸，深度为滤波器的个数。

如输入图像的尺寸大小为 32 x 32 x 3，滤波器的尺寸大小为5 x 5 x 3。那么特征图的大小是由存储的特征值的多少决定的。

对于输入图像的尺寸为 32 x 32，填充0的宽度为0，即没有填充，当步长为1时，滤波器 5 x 5在输入图像的每一行只能进行（32 +2 * 0– 5）/1 +1= 28次求取特征值。同理，每一列也是一样的，特征图中特征值的尺寸为 28 x 28个。

当步长为2时，特征图的尺寸为(32 + 2 * 0 - 5)/2 +1 = 14，其中的除法是要向下取整的，即尺寸为14 x 14。

当步长选取过大时，得到的特征值很少，但是计算量很小。
当步长选取很小时，得到的特征值很多，但是计算量很大。

我们也经常看到输入图像经过滤波器后有好几个特征图，这是因为用了多个滤波器来特征值。有几个滤波器，就有几个特征图。将得到的特征图都堆叠到一起，就得到了卷积层的输出结果。如下图所示，生成了两个特征图。
在这里插入图片描述

卷积不仅可以在输入图像上进行，还可以在卷积后的输出特征图上进行。

如下图所示，第一次卷积操作后，通过6个滤波器，得到了6个特征图组成的卷积结果，再次对特征图进行卷积，通过10个滤波器，得到了10个特征图组成的卷积结果。

在这里插入图片描述

（四）池化层

对特征图进行操作，将特征图压缩，也是用与卷积差不多的操作，选取小区域在特征图中滑动，在小区域中求取mean值或者Max值，用来代表这一小区域的特征值，即将这一小区域的特征值压缩为一个值。

（五）全连接层

卷积神经网络最后的全连接层与经典神经网络的全连接层是一样的，它将前面卷积层，池化层后的特征图提取出来，计算该输入图像属于某个类别的概率。

在这里插入图片描述

二．卷积神经网络的优势

经典的神经网络是全连接的网络，每个层次之间都是全连接的，参数非常庞大。

但是卷积神经网络就将每个特征图的参数实现了共享，即每个特征图中的神经元对应的参数都是一样的。

比如，卷积输出了2个特征图，输入图像的尺寸为 32 x 32 x 3， +pad2，Stride= 1，两个滤波器5 x 5 x 3，则输出的特征图尺寸为32 x 32 x 2，可以得知特征图中的特征值有 32 x 32个，而每一个特征值都是由滤波器对输入图像卷积得来的，即每个特征值对应输入图像中的一个5 x 5 x 3区域，即75个参数，而每个特征值的参数都是不同的，因此如果是全连接的话，共有32 x 32 x 5 x 5 x 3个参数，这个数字太庞大了，对计算效率不利。

卷积神经网络将每个特征值对应的75个参数都共享了，即每个特征图中32 x 32个特征值的参数都是一样的。那么如果是两个特征图就只需要 75 x 2 = 150个参数。

关注公众号【计算机视觉与深度学习】，获取海量计算机视觉与深度学习资源，实战项目源码，最新论文下载，大厂面试经验！！！

本文地址：https://blog.csdn.net/Mrwxxxx/article/details/107450596

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

浅谈Java分布式架构下如何实现分布式锁

01分布式锁运用场景　　互联网秒杀，抢优惠卷，接口幂等性校验。咱们以互联网秒杀为例。　@restcontroller　　@slf4j　　publicclassi... [阅读全文]
详解SpringBoot修改启动端口server.port的四种方式

方式一: 配置文件 application.propertiesserver.port=7788方式二: java启动命令# 以应用参数的方式java -jar... [阅读全文]
Spring AOP里的静态代理和动态代理用法详解

什么是代理？　　为某一个对象创建一个代理对象，程序不直接用原本的对象，而是由创建的代理对象来控制原对象，通过代理类这中间一层，能有效控制对委托类对象的直接访问，... [阅读全文]
java实现通讯录管理系统

本文实例为大家分享了java实现通讯录管理系统的具体代码，供大家参考，具体内容如下完成项目的流程：1.根据需求，确定大体方向 2.功能模块分析 3.界面实现 4... [阅读全文]
Java中数据库常用的两把锁之乐观锁和悲观锁

在写入数据库的时候需要有锁，比如同时写入数据库的时候会出现丢数据，那么就需要锁机制。　　数据锁分为乐观锁和悲观锁，那么它们使用的场景如下：　　1. 乐观锁适用于... [阅读全文]
git在idea中的冲突解决方法(非常重要)

1、git冲突的场景情景一：多个分支代码合并到一个分支时；情景二：多个分支向同一个远端分支推送代码时；实际上，push操作即是将本地代码merge到远端... [阅读全文]
Java代码生成器的制作流程详解

1. 前言前几天写了篇关于mybatis plus代码生成器的文章，不少同学私下问我这个代码生成器是如何运作的，为什么要用到一些模板引擎，所以今天来说明下代码生... [阅读全文]
Java中生产者消费者问题总结

生产者-消费者算是并发编程中常见的问题。依靠缓冲区我们可以实现生产者与消费者之间的解耦。生产者只管往缓冲区里面放东西，消费者只管往缓冲区里面拿东西。这样我们避免... [阅读全文]
Java 编程中十个处理异常的建议

一、尽量不要使用e.printstacktrace(),而是使用log打印。反例:try{ // do what you want }catch(excepti... [阅读全文]
Spring boot热部署devtools过程解析

1 pom.xml文件注：热部署功能spring-boot-1.3开始有的<dependency> <gr... [阅读全文]