VisionPro Deep Learning 용어

Deep Learning 개념/용어 정의

특징

Feature는 이미지에서 시각적으로 구별할 수 있는 영역입니다. Feature는 대개 응용 프로그램의 관심 대상(결함, 개체, 개체의 특정 구성 요소)을 나타냅니다.

Feature 크기

Green 분류의 Focused 모드, Red, Blue 위치 및 Blue 읽기 도구에서만 이용할 수 있습니다.
이미지 Feature 크기는 이미지 정보를 분석할 때 가장 중요합니다. Feature 크기는 샘플링에 이용되는 이미지 영역의 크기를 결정합니다.

Labeling(라벨 지정)

라벨 지정은 이미지에 "ground truth" 주석을 다는 과정입니다. 라벨 지정은 사용 중인 도구에 따라 달라집니다. 이미지에 라벨을 지정하는 이유는, 도구 트레이닝에 필요한 정보 제공과 트레이닝된 도구 성능의 측정 및 ground truth 대비 검증의 두 가지입니다.

Marking(마킹)

이미지 마킹은 Deep Learning이 작성한 주석입니다. 도구가 생성한 마킹은, 도구가 특정 이미지를 프로세싱하면서 얻은 "답"입니다. 도구가 생성한 마킹과 동일 이미지에 대해 사용자가 적용한 라벨을 비교하여 도구의 성능을 검증하게 됩니다. 라벨과 마찬가지로, 생성되는 구체적인 마킹은 도구에 따라 다릅니다.

변화

변화는 구체적인 변화 유형의 영향을 시뮬레이션하여 부품 및 이미지의 분산에 대해 트레이닝된 네트워크의 허용 오차를 향상하는 과정입니다.

Training Image Set(트레이닝 이미지 Set)

구체적인 응용 프로그램에 쓰이는 이미지의 모음. 트레이닝 이미지 Set는 런타임 시스템의 조명, 광학적, 기계적 특성을 이용해 일관되게 촬상한 구체적인 부품 또는 공정의 이미지를 대표해야 합니다. 트레이닝 이미지 Set는 정상적인 운영 시 기대되는 이미지 외관의 기대 범위를 나타내는 이미지를 포함해야 합니다.

Validation

라벨이 지정되었지만 도구 트레이닝에 이용되지 않은 이미지를 이용해 도구의 성능을 평가하는 과정.

Epoch 횟수

딥러닝 도구들은 샘플 이미지 데이터를 네트워크에 input으로 제공하고, 데이터를 프로세싱하고, 결과를 기대되는 Ground Truth와 비교하고, 네트워크 가중치를 조정하여 다시 시도하는 일을 반복함으로써 트레이닝됩니다. Epoch 횟수는 각 input 샘플이 네트워크를 통해 프로세싱되는 횟수를 말합니다.

Overfitting(오버피팅)

신경망 트레이닝에는 전체적인 네트워크가 이미지 트레이닝 Set로부터 해당 이미지 Set의 ground truth 라벨에 일치하는 답을 내놓을 때까지 반복적으로 네트워크 내 노드의 가중치를 조정하는 일이 포함됩니다. 트레이닝에 이용되는 트레이닝 Epoch가 많을수록, 네트워크는 트레이닝 Set 이미지에 더 정확하게 응답하게 됩니다. 하지만, 어느 정도의 트레이닝 후에는, 트레이닝 Set에 대한 네트워크의 성능이 향상되지만 새로운 이미지에 대한 열악한 성능이 따라오게 됩니다. 이것이 오버피팅입니다.

모델 선택 최소 Epochs 모델 선택 최소 Epochs는 High Detail 모드에서 최종 모델을 선택하기 위한 최소 Epochs 조건입니다.
Patience Epochs 다운샘플링 수준
패치 크기 각 뷰를 여러 조각으로 쪼개는 정사각형(패치)의 픽셀 단위 크기입니다. 각 뷰의 트레이닝(특징 검출)과 프로세싱은 각 chunk를 기반으로 실행됩니다.
Stride(패치 추출 간격) 뷰에서 패치 단위로 특징을 추출할 때, 패치의 크기 대비 패치가 추출되는 간격의 비율.
다운샘플링 수준

다운샘플링한 버전의 결함 확률 히트맵을 생성할 때 사용할 다운샘플링의 크기

Labeling Error(라벨 지정 오류)

사용자가 제공한 ground truth 정보가 부정확한 경우 라벨 지정 오류가 발생합니다. 전형적인 예로는, OCR의 문자에 잘못된 라벨을 지정하는 경우, 모든 이미지의 특정 feature의 모든 인스턴스에 라벨을 지정하지 못하는 경우, 특정 결함 영역에 범위에 지정된 라벨이 일관되지 않은 경우 등이 있습니다. 라벨 지정 오류는 도구 성능을 크게 떨어뜨립니다.

ROC

수신자 조작 특성(ROC)은, 트레이닝 매개변수의 특정 Set를 특정 트레이닝 이미지 Set에 적용할 때, 이에 의해 보여지는 Precision과 Recall 사이의 상반 관계를 시각화하고 분석할 수 있는 그래픽 도구입니다.

F-score

F-score(또는 F1 score)는 Precision과 Recall 점수 간의 조화 평균으로서 테스트의 정확도를 나타냅니다.

Precision

검출된 feature 또는 클래스 중 라벨과 정확하게 일치하는 feature 또는 클래스의 백분율.

Recall

도구에 의해 정확하게 식별된, 라벨 지정된 feature 또는 클래스의 백분율.

Training Fraction(트레이닝 비율)

이미지 Set 중 트레이닝에 이용된 부분의 백분율. 이미지 Set의 한 부분만을 트레이닝에 이용함으로써, 처음 보는 이미지로 트레이닝된 도구의 성능을 검증할 수 있습니다.

샘플링 밀도

이미지 내에서 샘플 간에 샘플링 지점이 이동하는 양을 말하며, feature 크기를 기준으로 표현됩니다. Feature 크기가 100이고 샘플링 밀도가 1이라면, 샘플링 위치는 샘플 간에 100픽셀 이동합니다. 샘플링 밀도가 4이면, 샘플 간에 25픽셀 이동합니다.

이미지의 뷰는 이미지 내의 픽셀 영역을 말합니다. 도구 프로세싱은 뷰 내의 픽셀에 제한됩니다. 사용자는 뷰를 수작업으로 지정할 수도 있고, 상위 도구의 결과를 이용해 뷰를 생성할 수도 있습니다.

마스크 이미지

뷰와 같은 크기의 2차원 픽셀 배열. 마스크 이미지의 픽셀 값은, 뷰의 해당 픽셀이 트레이닝에 이용될지 런타임 프로세싱에 이용될지 결정하는 데 이용됩니다.

모델

Feature 세트의 특정 공간 배열 (Blue 위치 및 Blue 읽기 도구만).사후 프로세싱 단계에서, Blue 위치 및 Blue 위치 도구는 이미지에서 검출된 모든 feature를 해당 도구에 대해 정의된 모델에 맞출 수 있습니다. 이어서 모델의 전체적인 pose 및 ID가 반환됩니다.