신경망 트레이닝 제어

트레이닝 셋

네트워크 트레이닝 단계에 가장 큰 영향을 미치는 요소는 트레이닝 Set의 구성입니다.트레이닝 셋 네트워크 트레이닝 단계를 제어하는 최선의 방법은 해당 도구에 대한 트레이닝 이미지 샘플 Set를 구축하는 것입니다. 이렇게 함으로써, 해당 도구가 이미지/뷰를 적절히 일반화하는지 여부를 판단할 수 있도록 이미지/뷰를 범주로 분류할 수 있습니다. 모든 도구가 트레이닝 세트를 사용하지만, High Detail 도구는 트레이닝 세트 일부를 "validation 세트 또는 validation 데이터"라는 이름으로 분리해 사용합니다. 트레이닝 세트 중 얼마만큼을 이 데이터 세트로 사용할지는 사용자가 결정합니다. High Detail 모드 트레이닝 시 각 신경망 모델은 validation loss(validation 데이터에서 계산되는 loss)를 계산합니다. 그리고 성능, 가용성 측면에서 가장 좋은 validation loss를 보이는 모델을 트레이닝 결과로 최종 선택합니다.

Validation Loss (High Detail 모드)

검증 데이터를 사용하는 목적은 트레이닝 데이터에서 생성된 많은 신경망 모델들 중에서 트레이닝 결과로 반환하기 위한 가장 좋은 모델을 선택하는 것입니다. 이러한 목적을 달성하고자 validation 데이터를 활용하는 트레이닝 전략을 여기에서는 "validation을 활용한 트레이닝"이라고 부릅니다. Focused 모드 도구와는 달리, High Detail 모드(Green 분류 High Detail 모드와 Red 분석 High Detail 모드)들은 validation을 활용한 트레이닝을 제공하며, validation loss를 모니터링하여 신경망 트레이닝을 제어할 수 있습니다. 트레이닝 중 매 1/8 epoch가 끝날 때마다, 신경망은 미리 구성한 Validation Set으로부터 Loss 값을 계산합니다.

Validation Loss는 분류(Green 분류 High Detail 모드) 또는 세분화(Red 분석 High Detail 모드)의 정확도 측면에서 학습된 네트워크의 성능을 나타내며, 이는 Loss가 작을수록 일반적으로 더 나은 네트워크라는 것을 의미합니다. 따라서 0에 가까운 값을 가질수록 좋습니다.

그러나, 네트워크가 실제로 얼마나 동작을 잘 하는지에 대한 완전한 통찰을 얻으려면, 학습된 네트워크를 별도의 데이터(테스트 데이터)에 대해서 테스트하여 과적합을 방지해야 합니다.

Green High Detail 모드의 Validation Loss는 각 뷰에서 분류가 실행될 때 뷰 별로 계산됩니다. 한편, Red 분석 High Detail 모드의 Validation Loss는 각 픽셀에서 “양호” 혹은 “결함”의 이진 분류인 세분화가 실행될 때 픽셀 별로 계산됩니다.

Validation Loss

Green 분류 High Detail 도구의 Validation Loss (단위: %)
- 100 – 각 클래스의 분류 precision의 평균 값
Red 분석 High Detail 도구의 Validation Loss (단위: %)
- 100 - "결함" 클래스의 recall + 40 x (100 - "양호" 클래스의 recall)

Note: Red 분석 도구 High Detail Quick 모드과 Green 분류 도구 High Detail Quick 모드은 validation set를 필요로 하지 않으며 따라서 validation loss를 제공하지 않고 Loss Inspector를 지원하지 않습니다. 이는 트레이닝 시 validation을 수행하지 않기 때문입니다.

Tip: 각 High Detail 모드 트레이닝 시에 Validation Loss의 변화를 Loss Inspector로 모니터링할 수 있습니다.