Inception Score (IS)
Inception Score(简称IS)是衡量生成模型(例如GAN)生成图像质量的一个重要指标。其核心思想是衡量生成图像的“清晰度”和“多样性”。
计算方式:
- 清晰度:生成的图像是否能被分类网络(通常是Inception网络)准确地分类。如果生成的图像属于某个类别并且网络能够自信地给出一个高概率,那么说明图像的内容清晰,容易被识别。
- 多样性:如果生成的图像种类非常丰富,分类网络的输出应该会具有较大的分布差异。换句话说,生成图像的类别不应该过于集中在某一类。
具体地,IS是通过以下步骤计算的:
- 先通过Inception网络对生成的每一张图片进行分类,得到每张图片的预测概率分布。
- 然后计算这些预测概率分布的KL散度(Kullback-Leibler divergence),也就是衡量不同生成图像之间的多样性。
- 最后将这些多样性和图像的清晰度结合起来,得到最终的得分。
公式:
Inception Score的计算公式为:
[
IS = \exp\left(\mathbb{E}x[D{KL}(p(y|x) || p(y))]\right)
]
其中,(p(y|x)) 是给定生成图像 (x) 后的类别概率分布,(p(y)) 是所有生成图像类别的均匀分布。
优点:
- 计算简单,直接利用了现有的预训练分类网络(如Inception v3)进行评估。
- 对生成图像的清晰度和多样性都有一定的衡量。
缺点:
- 依赖Inception网络:Inception Score的好坏很大程度上取决于Inception网络的能力。网络的训练集、分类的能力和网络的泛化能力可能影响最终评估的准确性。
- 局限性:IS没有直接考虑生成样本与真实数据之间的分布差异,可能导致一些细微的生成质量问题无法被反映出来。