Validation Set Ratio(Validation Set 비율)
Validation Set Ratio은 Green 분류 도구, Red 분석 도구의 High Detail 모드에서만 사용됩니다.
Validation Set 비율은 트레이닝 set으로 지정된 이미지 중 validation set으로 사용될 이미지의 비율입니다. 트레이닝 버튼을 클릭할 때마다 트레이닝 set에서 설정된 비율 만큼을 랜덤하게 뽑아 validation set으로 사용합니다.
테스트 Set과 Validation Set의 차이는 validation set은 학습 과정에 관여하지만 테스트 set은 전혀 관여를 하지 않는다는 것입니다. 테스트 Set은 오직 학습이 다 끝난 뒤에 일반적인 데이터에 대해 좋은 성능을 보이는 모델을 선택할 때만 사용됩니다.
- 예를 들면, validation set 없이 epoch횟수를 너무 크게 설정한 경우 training set에 대해서 오버피팅(overfitting)된 모델이 생성될 수 있습니다. 만일 높은 epoch 횟수를 설정하고 validation set 없이 트레이닝을 시작했다면, 오버피팅이 일어나더라도 학습이 끝나기 전까지 이를 알 수 있는 방법이 없습니다 이 경우, 결국 오버피팅된 모델이 최종 모델로 생성되게 됩니다.
-
하지만 validation set을 설정하면, 학습이 진행되는 동안 트레이닝 set에서의 성능과 validation set에서의 성능을 비교하여 특정 시점 이후에서validation set의 성능이 지나치게 낮아질 경우 과적합이 발생했다고 판단할 수 있습니다. 그리고 전체 학습이 끝난 뒤, 과적합이 일어나기 전에 생성된 모델을 최종 모델로 선택할 수 있습니다.
-
이렇게 Validation Set은 학습 과정 중에 unseen data(보여지지 않은 데이터)에 대한 성능을 확인하여 모델을 보정하는데 관여합니다.