FID

Fréchet Inception Distance (FID)

FID 是一个更为复杂且更为精细的评估生成图像质量的指标。它的灵感来源于计算生成数据和真实数据在特征空间的距离。相较于Inception Score,FID更关注生成样本和真实样本之间的统计差异。

计算方式

  • 通过Inception网络提取生成图像和真实图像的特征(通常是在网络的某一层中提取激活值,像是倒数第二层的输出)。
  • 对这些特征进行统计建模,通常假设它们符合高斯分布。
  • 然后计算生成图像特征和真实图像特征的Fréchet距离(即均值和协方差矩阵的差异)。

Fréchet距离本质上衡量的是两组数据的高斯分布之间的差异。FID越小,表示生成样本和真实数据越相似。

FID公式

假设我们从生成图像和真实图像中分别得到特征均值和协方差:

  • ( \mu_r, \Sigma_r ) 是真实数据的均值和协方差。
  • ( \mu_g, \Sigma_g ) 是生成数据的均值和协方差。

那么,FID的计算公式为:

[
FID = \left| \mu_g - \mu_r \right|^2 + \text{Tr}\left( \Sigma_g + \Sigma_r - 2 \left( \Sigma_g \Sigma_r \right)^{1/2} \right)
]

其中,( \mu_g ) 和 ( \mu_r ) 是生成图像和真实图像的特征均值,( \Sigma_g ) 和 ( \Sigma_r ) 是它们的协方差矩阵。

优点

  • 更符合人类评判:相比于IS,FID更能捕捉生成图像与真实图像的高层次统计差异,更符合人类对图像质量的直觉感知。
  • 不依赖类别:FID不关心生成图像属于哪一类,而是看其是否能够生成真实数据分布中的多样性,这使得它比IS更为全面。

缺点

  • 计算更复杂:FID需要计算特征的均值和协方差,计算过程比Inception Score要复杂。
  • 依赖于Inception网络:虽然FID对生成图像的评价比IS更为全面,但它仍然依赖于一个预训练的Inception网络。如果该网络没有覆盖到某些特定的图像类型,可能会影响评估的准确性。
Contents
  1. 1. Fréchet Inception Distance (FID)
    1. 1.1. 计算方式:
    2. 1.2. FID公式:
    3. 1.3. 优点:
    4. 1.4. 缺点:
|