当前位置：服务支持 > 软件文章 > TensorFlow卷积神经网络猫狗分类挑战与升级

TensorFlow卷积神经网络猫狗分类挑战与升级

阅读数 391

Tensorflow2.0——卷积神经网络

卷积神经网络
卷积
池化与采样
经典卷积神经网络
LeNet-5
AlexNet
VGG
GoogLeNet
ResNet
ResNet实现
比较
Batch Normalization

卷积神经网络

卷积

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_02

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_03

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_04

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_05

layers.Conv2D

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_06

weight&bias

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_07

nn.conv2D

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_08

池化与采样

池化：Max/Avg pooling

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_09

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_10

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_11

上采样：upsample

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_12

UpSampling2D：

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_13

Relu：

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_14

经典卷积神经网络

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_15

LeNet-5

MNIST数据集上：99.2%acc ；

网络层：5/6layers：2卷积层+3全连接层

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积神经网络_16

AlexNet

准确率提升10%+

网络层：5卷积层+3全连接层

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_17

VGG

VGG有不同的版本：VGG11、VGG16、VGG19

创新点：探索了一种更小型的卷积核（1x1、3x3），关注更小的视野，不会损害计算精度，也不会增大所需计算的参数量，效率较佳。

kernel卷积核的数量决定了输出的feature map的大小。

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_18

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_19

GoogLeNet

在同一个卷积层中使用不同的卷积核（1x1、3x3、5x5）。综合了不同视角的视野，观察更全面。
假如都使用32个卷积核，输入为[28x28]，那么max pooling会输出[14x14]维度，那么另外三个卷积核的strides都应为2，才能对应输出[14x14]与池化层维度匹配，经过concatenation合并成为32*4 [14x14]个输出。

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_20

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积_21

前面有16层，后面有6层，可以分开使用也可以全部使用，根据target计算loss去优化。

一个网络单元unit：卷积Conv+BatchNorm+池化pooling+激活Relu

ResNet

ResNet是现在使用最广泛、意义最大的一种卷积神经网络。
深层次的神经网络一步步求导时会导致误差的堆叠，会更容易出现梯度离散和梯度爆炸现象，所以不能一味的堆叠网络层数。

它对每层的输入做一个reference, 学习形成残差函数，而不是学习一些没有reference的函数。这种残差函数更容易优化，能使网络层数大大加深。

在计算机视觉里，特征的“等级”随增网络深度的加深而变高，研究表明，网络的深度是实现好的效果的重要因素。然而梯度弥散/爆炸成为训练深层次的网络的障碍，导致无法收敛。

有一些方法可以弥补，如归一初始化，各层输入归一化，使得可以收敛的网络的深度提升为原来的十倍。然而，虽然收敛了，但网络却开始退化了，即增加网络层数却导致更大的误差，如下图。这种deep plain net收敛率十分低下。

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_22

通过在一个浅层网络基础上叠加y=x的层（称identity mappings，恒等映射），可以让网络随深度增加而不退化。这反映了多层非线性网络无法逼近恒等映射网络。

但是，不退化不是我们的目的，我们希望有更好性能的网络。resnet学习的是残差函数F(x) = H(x) - x, 这里如果F(x) = 0, 那么就是上面提到的恒等映射。事实上，resnet是“shortcut connections”的在connections是在恒等映射下的特殊情况，它没有引入额外的参数和计算复杂度。假如优化目标函数是逼近一个恒等映射, 而不是0映射，那么学习找到对恒等映射的扰动会比重新学习一个映射函数要容易。从下图可以看出，残差函数一般会有较小的响应波动，表明恒等映射是一个合理的预处理。

残差学习的基本单元：

TensorFlow基于卷积神经网络猫狗图像分类缺点 tensorflow2卷积神经网络_卷积核_23