视觉深度学习
此主题通过介绍整个工作流解释了 VisionPro Deep Learning 的工作方式。
工作流摘要
-
收集图像
在对比度是关键的标准机器视觉应用程序中,应遵循图像质量的最佳实践。在图像内,缺陷和特征必须能够被人分辨。控制所有可能的变量,例如一致的照明、工作距离、相机触发定时等。
-
标签
它为工具建立了基本事实,包括是良好还是不良、什么是关注特征、字符是什么,以及图像中包含什么类型的内容。标注所有视图很重要,并且标注必须准确。
-
设置工具参数
Deep Learning 工具参数用于调整网络训练和处理图像的方式。要调整的最常用工具参数如下:
- 特征尺寸/像素块大小
- 训练集
- 扰动参数
- 采样密度
通常,参数的默认设置对于大多数图像集效果良好。尝试训练,先不要调整特征尺寸旁边的任何参数。
-
训练
训练是您的工具(神经网络)根据您制作的标签学习特征(像素)的过程。例如,红色分析工具将根据您绘制的缺陷/正常标签学习每个图像中的缺陷/正常像素。红色分析工具训练的目标是学习足够多的知识,为不可见图像提供是否有缺陷的正确检测结果。训练的关键是确保将所有可能的变化都包括在训练集中,并且图像被正确标注。训练时间因应用程序、工具设置以及用于训练网络的 PC 中的 GPU 而异。
-
检查标记
标记代表每个图像 Deep Learning 结果,并且每个工具都有唯一的图形表示。标注由开发人员生成。标记是由 Deep Learning 生成的。
-
评估结果
其他工具结果显示在数据库概述面板中。对于每个工具,这包括工具的处理时间、得分和其他统计分析。
收集图像
Deep Learning 工具能够处理图像和照明变化,但必须让工具了解可变性可能带来的内容。如果图像之间的照明可能更亮或更暗,则捕获图像中的可变性,并通过将这些图像添加到训练图像集指导使用照明可变性的工具。
配置照明和成像选项时,您可以使用典型的机器视觉照明和光学技术。但是,对于 Deep Learning,您要确保照明和光学在训练和生产之间保持一致。例如,如果您根据某种照明和光学设置训练图像,然后在生产过程中更改该配置,那么该工具的性能将基于初始设置,从而在生产过程中失败。
如果可能,使用受控照明来避免环境照明或照明设置差异引起视觉变化而导致的影响。设置相机时,请确保实验室中的相机设置与生产过程中使用的相机设置相同。还尝试最小化透视失真、改变镜头焦点、景深和视野。
标注
由于 Deep Learning 软件基于学习,因此向网络传授的关于图像的知识非常重要。在 Deep Learning 的说法中,这个过程称为“标注”。标注是用户识别特征或缺陷并在图像上以图形方式说明特征或缺陷的过程。标签为工具呈现“真值”,用于训练工具并评估其性能。
标签为工具呈现“基本事实”,也就是您告诉工具,这是它应该学习的东西。对工具编程最重要的部分是确保用于训练的图像被完全、准确地标注。在不知道图像的真值数据的情况下,您无法判断工具是否正常工作。此外,如果没有准确的标注,工具的训练也不会起作用。
标注是创建深度学习应用程序最重的要部分。请记住以下信息:
- 在评估工具和应用程序的性能时,会始终根据您提供的标注来衡量。如果您的标注未能反映图像的实际真值,那么即使工具性能准确且可重复,也没有任何意义。
- 在您训练 Deep Learning 工具时,训练目标 – 成本函数 – 会尝试训练工具以产生与您提供的标注精确匹配的响应。
训练
按以下一般方式进行神经网络训练:
- 对于图像集中将用于训练的每个图像,将使用指定的特征尺寸对整个范围进行采样。
- 得到的样本提供给 VisionPro Deep Learning 深度神经网络,作为输入数据。
- 对于每个样本,神经网络产生特定的响应(取决于工具类型),并且将该响应与与训练图像中的样本位置相关联的图像标注进行比较。
- 在处理和重新处理样本时,网络内的内部权重会经历反复调整。网络训练系统不断调整网络权重,其目的是减少网络响应与用户提供的标注之间的误差(差异)。
- 整个过程重复多次,直到每个训练图像的每个样本都至少被包括了时期计数参数指定的次数。
|
|
| 符号 | 定义 |
| 1 | 采样区域。 |
| 2 | 用户绘制的已标注缺陷区域。 |
| 3 | 神经网络。 |
| 4 | 网络的反应。 |
| 5 | 调整权重以减少标注缺陷(黄色)和网络响应(蓝色)之间的差异(也就是误差)的迭代过程。 |
神经网络训练的具体特征在某种程度上取决于所训练的工具的类型。您可以用来影响网络训练阶段的最大单一决定因素是训练图像集。所有工具的默认行为是随机选择图像集中 50% 的图像进行训练。
检查标记
标记是工具基于在训练之前完成的标注而放置在工具识别图像的字符、特征和/或区域上的图形元素。工具经过训练后,就可以处理数据库中的图像以及新采集的图像,并将标记放置在它找到的特征上。例如,蓝色定位要求在视图上标注 N 个特征。工具经过训练后,结果以标记的形式报告,也就是在视图上叠加图形。
要为进一步训练提供更多标注数据,您可以将某些标记转换为标签。在这种情况下,您查看该工具应用的标记,如果您同意标记,则接受视图并将标记转换为标签。
评估结果
每个 VisionPro Deep Learning 工具都提供以下统计结果数据:
- 混淆矩阵 - 这是基本事实与工具预测的直观表示。
- 召回 - 工具正确识别的标注特征或类的百分比。
- 精度 - 已检测到的与标注特征或类相匹配的特征或类的百分比。
- F-得分 - 召回和精度的调和平均值。
VisionPro Deep Learning中每个工具的这些统计指标的使用有助于限定以下内容:
- 估计未来的表现,例如估计假正值率。
- 通过找到良好的参数组合或设置各种阈值来优化工具参数。
- 测试模型结果的再现性。
不能依据以下任何一项来评估基于深度学习的神经网络模型的性能:
- 神经网络模型的质量“等级”
- 神经网络的质量没有等级。
- 作为神经网络模型输出的“得分”
- 神经网络有几个指标,可以从几个不同的角度展示其性能,但没有一个值可以绝对代表神经网络的适用性和性能。