14.12. 神经风格迁移¶

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 Colab 中打开 Notebook

在 SageMaker Studio Lab 中打开 Notebook

如果你是一位摄影爱好者，你也许接触过滤镜。它能改变照片的颜色风格，从而使风景照更加锐利或者人像照皮肤更加美白。然而，一个滤镜通常只能改变照片的某个方面。如果要照片达到理想的风格，你可能需要尝试大量不同的滤镜组合。这个过程的复杂程度不亚于模型调参。

在本节中，我们将学习如何使用卷积神经网络，来自动将一个图像中的风格应用在另一图像之上，即*风格迁移*（style transfer） (Gatys et al., 2016)。这项工作需要两张输入图像：一张是*内容图像*，另一张是*风格图像*。我们将使用神经网络修改内容图像，使其在风格上更接近风格图像。例如，图 14.12.1中的内容图像是我们在西雅图郊区的瑞尼尔山国家公园拍摄的风景照，而风格图像则是一幅主题为秋天橡树的油画。在输出的合成图像中，应用了风格图像的油画笔触，颜色也更加鲜艳，同时保留了内容图像中物体的主要形状。

图 14.12.1 给定内容图像和风格图像，风格迁移输出合成图像。¶

14.12.1. 方法¶

图 14.12.2用一个简化的例子说明了基于卷积神经网络的风格迁移方法。首先，我们初始化合成图像，例如，将其初始化为内容图像。该合成图像是风格迁移过程中唯一需要更新的变量，即风格迁移所需迭代的模型参数。然后，我们选择一个预训练的卷积神经网络来抽取图像的特征，在模型训练过程中无须更新模型的参数。这个深度卷积神经网络凭借多个层逐级抽取图像的特征，我们可以选择其中某些层的输出作为内容特征或风格特征。以图 14.12.2为例，这里选取的预训练的神经网络含有3个卷积层，其中第二层输出内容特征，第一层和第三层输出风格特征。

图 14.12.2 基于卷积神经网络的风格迁移。实线表示正向传播，虚线表示反向传播。¶

接下来，我们通过正向传播（实线箭头方向）计算风格迁移的损失函数，并通过反向传播（虚线箭头方向）迭代模型参数，即不断更新合成图像。风格迁移常用的损失函数由3部分组成：（i）*内容损失*（content loss）使合成图像与内容图像在内容特征上接近；（ii）*风格损失*（style loss）使合成图像与风格图像在风格特征上接近；（iii）*全变分损失*（total variation loss）则有助于减少合成图像中的噪点。最后，当模型训练结束时，我们输出风格迁移的模型参数，即得到最终的合成图像。

下面，我们将通过一个具体的实验来了解风格迁移的技术细节。

14.12.2. 读取内容和风格图像¶

首先，我们读取内容图像和风格图像。从打印出的坐标轴可以看出，它们的尺寸有所不同。

14.12.1. 方法¶

14.12.2. 读取内容和风格图像¶

14.12.3. 预处理和后处理¶

14.12.4. 抽取特征¶

14.12.5. 定义损失函数¶

14.12.5.1. 内容损失¶

14.12.5.2. 风格损失¶

14.12.5.3. 全变分损失¶

14.12.5.4. 损失函数¶

14.12.6. 初始化合成图像¶

14.12.7. 训练模型¶

14.12.8. 小结¶

14.12.9. 练习¶