2026/1/16 21:49:39
网站建设
项目流程
杭州市网站制作,广州地铁运营最新消息,医疗器械分类,苏州推广排名周为第四课的第一周内容#xff0c;这一课所有内容的中心只有一个#xff1a;计算机视觉。应用在深度学习里#xff0c;就是专门用来进行图学习的模型和技术#xff0c;是在之前全连接基础上的“特化”#xff0c;也是相关专业里的一个重要研究大类。这一整节课都存在大量…周为第四课的第一周内容这一课所有内容的中心只有一个计算机视觉。应用在深度学习里就是专门用来进行图学习的模型和技术是在之前全连接基础上的“特化”也是相关专业里的一个重要研究大类。这一整节课都存在大量需要反复理解的内容和机器学习、数学基础。 因此我会尽可能的补足基础用比喻和实例来演示每个部分从而帮助理解。本篇的内容关于池化操作与卷积中的反向传播是对本周内容的最后补完本篇之后我们就可以对卷积神经网络的基本组件与传播过程有一个较完整的认知。1. 池化层pooling layer除去卷积层和全连接层池化层也是卷积神经网络的一大基石不要被这个名字吓到它的原理反而是最简单的。常见的池化分为两种最大池化和平均池化。使用方法并不难我们直接摆出来最大池化不计算直接使用窗口最大值作为结果的卷积操作。平均池化用窗口所有像素的平均值作为结果的卷积操作。先来看最大池化我们通过课程里的例子补充一些细节image.png现在我们知道了最大池化怎么用了问题紧接着就来了这个操作是用来干嘛的 我们继续image.png你可能发现了一个 bug 那万一重要特征反而是被一堆大像素包围的小像素呢这样不是反而把最重要的特征扔了吗平均池化可以缓解这种现象image.png实际上池化最大的作用就是在卷积神经网络中减少特征图的空间尺寸来降低计算复杂度同时保留特征信息。而对于怎么池化更好更合适还是要在具体任务中不断尝试。此外对于输出特征图的大小计算卷积的输出公式在这里仍然适用输出尺寸注向下取整而对于多通道的池化处理也和卷积核的逻辑相同确保和输入图像的通道数相等。最后强调一点你会发现池化层只有人工设置的超参数没有任何参与传播的参数在其之后通常也不单独设置激活函数。下面我们来看一个完整卷积神经网络的传播过程。2. 卷积神经网络的反向传播现在我们先看一个加入了池化层的完整卷积网络补充一些细节image.png另外一点要强调的是和全连接网络相通就是尽量让激活数每次应用激活函数的元素数量保持较平稳的下降趋势。 避免出现”50000→1“这种断崖式下降。现在我们就来看看这个网络的完整传播过程。image.png很显然列举出传播过程后问题紧接着就来了当梯度到达卷积层的时候我们是如何根据不确定数量的像素梯度更新确定数量的卷积核的呢我们详细展开一下标红部分image.png了解了逆展平和池化层传递参数后就来到了最关键的部分卷积核和偏置如何根据有空间结构的梯度更新 继续向下。image.png没错因为输出特征图中的每一个像素都是由卷积核与输入图像的区域运算后再加上偏置得到的那么就代表反向传播计算得到输出中每一个像素的梯度都和 9 个卷积核参数与 1个偏置常量相关。知道了这个如何更新就已经呼之欲出了image.png不写复杂的公式用一句话来概括就是某个参数的最终梯度 它对所有受影响的输出像素的偏导数之和。如果你忘了偏导和梯度的概念他们第一次出现在这里梯度下降法这就是卷积层的反向传播过程继续反向传播也是同样的道理。最后我们总结一下卷积层本身。3.卷积层的特点这一点的内容就更偏向理论了相比全连接层卷积层有两个突出的特点我们称之为参数共享和稀疏连接。来简单介绍一下不涉及太多具体应用就不详细展开了。参数共享 不同于全连接层对每个输入特征有单独的权重卷积层的输入图像共享卷积核和偏置参数。 原因是卷积核的适用性我们可以用边缘检测卷积核检测左上角的竖直边缘也可以用同样的卷积核检测右下角的竖直边缘。稀疏连接 不同于全连接层的输出和每个输入都有关卷积层输出特征图中的每个像素只和产生他的几个像素有关。 原因是图像的局部性要找猫耳朵只要看耳朵那一块就行了。4. 总结概念 原理 比喻池化层最大池化、平均池化 通过窗口取最大值或平均值减少特征图空间尺寸降低计算量同时保留关键特征无参与训练的参数。 “把照片压缩成缩略图”不用每个像素都看清只保留轮廓和显著信息。池化层的尺寸计算 与卷积相同使用通道数保持不变。 “裁剪图片”窗口大小、步幅决定裁剪后的尺寸。卷积层反向传播 输出每个像素的梯度都会对应卷积核全部参数卷积核梯度是所有相关输出像素偏导的总和偏置梯度是所有输出像素梯度的求和。 “每个菜被客人打了几分后厨每个厨师要根据这些评分回溯自己哪一步影响了结果。”参数共享 同一个卷积核扫描整个图像因此所有位置使用同一组权重大大减少参数量。 “同一个模具印图案”不论纸放哪里模具都是同一个。稀疏连接 卷积核只与局部区域相乘一个输出像素只依赖输入的一小块而非整张图。 “你只需要看猫脸附近就能判断有没有耳朵而不是看整张照片。”