14.7. 单发多框检测¶

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 SageMaker Studio Lab 中打开 Notebook

在第 14.3 节–第 14.6 节中，我们介绍了边界框、锚框、多尺度目标检测和目标检测数据集。现在我们已经准备好利用这些背景知识来设计一个目标检测模型：单发多框检测（SSD） (Liu et al., 2016)。这个模型简单、快速且被广泛使用。尽管这只是众多目标检测模型中的一个，但本节中的一些设计原则和实现细节也适用于其他模型。

14.7.1. 模型¶

图 14.7.1 概述了单发多框检测的设计。该模型主要由一个基础网络和几个多尺度特征图块组成。基础网络用于从输入图像中提取特征，因此可以使用一个深度卷积神经网络。例如，最初的单发多框检测论文采用了在分类层之前截断的VGG网络 (Liu et al., 2016)，而ResNet也已普遍使用。通过我们的设计，我们可以使基础网络输出更大的特征图，以便生成更多的锚框来检测较小的物体。随后，每个多尺度特征图块将前一个块的特征图的高度和宽度减小（例如，减半），并使特征图的每个单元在输入图像上增加其感受野。

回顾一下在第 14.5 节中通过深度神经网络对图像进行分层表示来实现多尺度目标检测的设计。由于图 14.7.1 中越靠近顶部的多尺度特征图越小，但具有更大的感受野，因此它们适合于检测更少但更大的物体。

简而言之，通过其基础网络和几个多尺度特征图块，单发多框检测会生成不同数量、不同大小的锚框，并通过预测这些锚框的类别和偏移量（从而得到边界框）来检测不同大小的物体；因此，这是一个多尺度目标检测模型。

图 14.7.1 作为一个多尺度目标检测模型，单发多框检测主要由一个基础网络和随后的几个多尺度特征图块组成。¶

接下来，我们将描述图 14.7.1 中不同模块的实现细节。首先，我们讨论如何实现类别和边界框的预测。

14.7.1.1. 类别预测层¶

设物体类别的数量为 \(q\)。那么锚框有 \(q+1\) 个类别，其中类别0是背景。在某个尺度上，假设特征图的高度和宽度分别为 \(h\) 和 \(w\)。当以这些特征图的每个空间位置为中心生成 \(a\) 个锚框时，总共需要对 \(hwa\) 个锚框进行分类。由于可能带来巨大的参数开销，这通常使得使用全连接层进行分类变得不可行。回想一下我们在第 8.3 节中如何使用卷积层的通道来预测类别。单发多框检测使用相同的技术来降低模型复杂度。

具体来说，类别预测层使用一个卷积层，而不改变特征图的宽度或高度。这样，在特征图的相同空间维度（宽度和高度）上，输出和输入之间可以存在一一对应的关系。更具体地说，在任何空间位置(\(x\), \(y\))上，输出特征图的通道代表了以输入特征图的(\(x\), \(y\))为中心的所有锚框的类别预测。为了产生有效的预测，必须有 \(a(q+1)\) 个输出通道，其中对于相同的空间位置，索引为 \(i(q+1) + j\) 的输出通道代表了对锚框 \(i\) (\(0 \leq i < a\)) 的类别 \(j\) (\(0 \leq j \leq q\)) 的预测。

下面我们定义这样一个类别预测层，通过参数 num_anchors 和 num_classes 分别指定 \(a\) 和 \(q\)。该层使用一个填充为1的 \(3\times3\) 卷积层。这个卷积层的输入和输出的宽度和高度保持不变。

14.7. 单发多框检测¶ Colab [pytorch]在 Colab 中打开 Notebook Colab [mxnet]在 Colab 中打开 Notebook Colab [jax]在 Colab 中打开 Notebook Colab [tensorflow]在 Colab 中打开 Notebook SageMaker Studio Lab在 SageMaker Studio Lab 中打开 Notebook

14.7.1. 模型¶

14.7.1.1. 类别预测层¶

14.7.1.2. 边界框预测层¶

14.7.1.3. 连接多尺度预测¶

14.7.1.4. 下采样块¶

14.7.1.5. 基础网络块¶

14.7.1.6. 完整模型¶

14.7.2. 训练¶

14.7.2.1. 读取数据集和初始化模型¶

14.7.2.2. 定义损失和评估函数¶

14.7.2.3. 训练模型¶

14.7.3. 预测¶

14.7.4. 小结¶

14.7.5. 练习¶

14.7. 单发多框检测¶

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 SageMaker Studio Lab 中打开 Notebook