计数选项和混淆矩阵

在混淆矩阵中,“计数”指的是一个实际-预测结果对。例如,下方的混淆矩阵显示了以下结果计数:

结果对 结果计数
实际良好 + 预期良好 136
实际斑点 + 预期良好 0
实际良好 + 预期斑点 1
实际斑点 + 预期斑点 14

“斑点”在这里指的是一种缺陷类,该类是在标注关闭 标注是用“真值”来注释图像的过程。根据您使用的工具,标注可以采用不同的形式。标注图像集有两个原因:提供训练工具所需的信息,并允许您根据真值衡量和验证受训练的工具的性能。标准类型红色分析工具的缺陷时定义的。此示例中的另一个缺陷类是“划痕”,未在图像中显示,因为混淆矩阵一次只能显示一个缺陷类。

数据库概述中计数的下拉菜单设置决定了用于计算混淆矩阵中计数和最终 F1 得分的结果。混淆矩阵中显示的值会根据您所选择的选项而变化。

您可以使用计数菜单:

将计数设置为基于视图或区域 设置缺陷类

视图和区域的定义

“视图”和“区域”这两个术语对应于红色分析工具使用的两种标注类型:

计数下拉选项

计数下拉菜单提供以下选项:

  • 视图:每个视图都会接收一个标注和一个标记。
  • 未训练视图:不属于训练集的每个视图都会获得一个标注和一个标记。

  • 区域:视图中的每个区域都会收到一个标注和一个标记。区域被分为缺陷区域(不良)和背景(良好),并据此进行标注和标记。

  • 未训练区域:视图中不属于训练集的每个像素都会接收到一个标注和一个标记。区域被分为缺陷(坏像素)和背景(好像素),并据此进行标注和标记。

基于视图的混淆矩阵计算

在将计数设置为视图未训练视图时,标注和标记是在每个视图上进行的,而不是在每个区域进行。如果某个视图中存在得分高于阈值的缺陷像素,则该视图被预测为“不良”。否则,将其预测为“良好”。

要将视图标记为“不良”,具有最高缺陷概率得分的缺陷像素可以位于视图中的任意位置,而不仅是位于标注的缺陷区域内。

在下面的示例中,选择了缺陷类“斑点”来表示“不良”结果。如果视图的任何缺陷类不是“斑点”,则视为“良好”。

要获取下面混淆矩阵中的“实际”计数:

  • 一个带有标注“斑点”的视图在混淆矩阵中被视为实际“斑点”。

  • 一个带有“良好”标注的视图被视为一个实际上的“良好”。

  • 一个带有“斑点”外缺陷类的视图视为一个实际上的“良好”。

获得“预期”结果:

  • 如果视图中所有像素的最高得分低于阈值,您将获得一个“良好”预测结果。

  • 如果在视图中所有像素的最高得分超过阈值,您将得到一个“斑点”预测结果。

预测是针对每个实际视图进行的,而不是针对每个区域。预测是根据阈值和实际视图的代表得分计算得出的。视图的代表得分是视图中像素的最高得分。每个得分是每个像素的缺陷概率。

基于区域的混淆矩阵计算

当您将计数设置为区域未训练区域时,会对每个区域而不是每个视图进行标注和标记。区域是一组根据阈值标记为缺陷的像素。

如果视图包含多个标记区域,则每个区域都会被纳入混淆矩阵的计算中。这意味着,一个视图在混淆矩阵中可以生成多个计数,而如果将计数设置为视图未训练视图,则在表中,一个视图只会生成一个计数。

在下面的示例中,“斑点”缺陷类被再次选择来表示“不良”结果,就像在前一部分中一样。如果视图的任何缺陷类不是“斑点”,则视为“良好”。

要获取下面混淆矩阵中的“实际”计数:

  • 一个带有“良好”标注的视图视作一个实际“良好”区域。整个视图被视作一个背景区域。

  • 如果视图中有标注为“斑点”的区域:

    • “斑点”区域的数量为 N,则在混淆矩阵中就会有 N 个实际“斑点”。

    • 此外,背景区域视作一个实际“良好”。

  • 如果视图中有任何区域标注为除“斑点”外的缺陷:

    • M 个标注为其他类的区域在混淆矩阵中视作 M 个实际“良好”。

    • 此外,背景区域视作一个实际“良好”。

  • 如果视图同时具有标注为“斑点”的缺陷区域和标注为其他缺陷类的缺陷区域:

    • “斑点”区域的数量为 N,则在混淆矩阵中就会有 N 个实际“斑点”。

    • 标注为其他类的 M 个区域在混淆矩阵中则有 M 个实际“良好”。

    • 此外,背景区域视作一个实际“良好”。

  • 仅限无监督类型工具:一个带有“不良”标注且没有像素级标注缺陷区域的视图视作一个“不良”实际区域。

要获得“预测”计数

  • 如果实际区域的最高分数低于阈值,您将获得一个“良好”预测结果。

  • 如果实际区域中的最高分数超过阈值,您将获得一个“斑点”预测结果。

对每个实际区域进行预测。预测值是根据阈值和实际区域的代表得分计算得出的。实际区域的代表得分是该区域内像素的最高得分。每个得分是每个像素的缺陷概率。

区域的实际-预测对计算示例

在下面的示例中,我们假设从实际区域找到的最高得分高于阈值

  • 当 N 个标记区域出现在背景(标注良好的像素)上,没有像素级标注缺陷,并且此视图本身被标注为“良好”时:

    → 1 个(实际)良好 -(预测)不良对

    (N 个标记区域被视为单个标记区域)

    在此示例中,3 个标记区域出现在背景上,无像素级标注缺陷,视图被标注为“良好”:

  • 当 N 个标记区域出现在背景(标注良好的像素)上,而没有像素级的标注缺陷,但整个视图本身被标注为“不良”时:

    → 1个(实际)不良 -(预测)不良对

    (N 个标记区域被视为单个标记区域)

    在此示例中,4 个标记区域出现在背景上,没有像素级标注缺陷,视图被标注为“不良”:

  • 当标记区域出现在像素级标注的缺陷区域上时:

    此时确定结果的一个重要因素是,总共有多少标记区域与像素级标注的缺陷区域重叠:

    • <案例 1>

      1 个像素级标注区域,

      1 个标记区域(与像素级标注区域重叠),

      1 个标记区域(不与像素级标注区域重叠并出现在背景上):



      1 个(实际)不良 -(预测)不良对(重叠),

      1 个(实际)良好 -(预测)不良对(不重叠),

      注意当视图中存在一个或多个像素级标注的缺陷区域时,除了标注区域外,一个块的所有像素都被视为“背景”,计为 1 个实际的“良好”区域。这适用于大多数情况,但不适用于视图中没有像素级标注区域但视图本身被标注为“不良”的情况。

      在此示例中,一个标记区域出现在背景上,另一个标记区域出现在像素级标注区域上(重叠),并且由于存在一个或多个像素级标注缺陷,此视图本身被标注为“不良”:

    • <案例 2>

      5 个像素级标注区域,

      3 个标记区域(每个区域与每个像素级标注区域重叠),

      2 个标记区域(不与任何像素级标注区域重叠并出现在背景上):



      3 个(实际)不良 -(预测)不良对(重叠),

      2 个(实际)不良 -(预测)良好对(不重叠),

      1 个(实际)良好 -(预测)不良对

      注意背景中出现的 2 个标记区域被视为单个标记区域,导致 1 个“不良”的预测区域。这也适用于 N 个标记区域的情况。
    • <案例 3>

      3 个像素级标注区域(A、B、C),
      3 个标记区域(2 个与 A 重叠,1 个与 B 重叠)
      1 个标记区域(不重叠 = 出现在背景上):

      1 个(实际)不良 -(预测)不良对(2 个与 A 重叠),
      1 个(实际)不良 -(预测)不良对(1 个与 B 重叠),
      1 个(实际)良好 -(预测)不良对(出现在背景上),
      1 个(实际)不良 -(预测)良好对 (C)