14. 计算机视觉¶
无论是医疗诊断、自动驾驶、相机监控,还是智能滤镜,计算机视觉领域的诸多应用都与我们当前和未来的生活息息相关。近年来,深度学习一直是推动计算机视觉系统性能发展的变革性力量。可以说,最先进的计算机视觉应用几乎都离不开深度学习。有鉴于此,本章将重点关注计算机视觉领域,并探讨近期在学术界和工业界具有影响力的各种方法和应用。
在 第 7 节 和 第 8 节 中,我们研究了计算机视觉中常用的各种卷积神经网络,并将它们应用于简单的图像分类任务。在本章的开始,我们将介绍两种可以提高模型泛化能力的方法,即图像增广和微调,并将它们应用于图像分类。由于深度神经网络能够有效地在多个层次上表征图像,这种分层表征已成功地用于各种计算机视觉任务,例如目标检测、语义分割和样式迁移。遵循在计算机视觉中利用分层表征的关键思想,我们将从目标检测的主要组件和技术开始。接下来,我们将展示如何使用全卷积网络对图像进行语义分割。然后,我们将解释如何使用样式迁移技术来生成像本书封面一样的图像。最后,我们通过将本章以及前面几章的内容应用到两个热门的计算机视觉基准数据集来结束本章。