Validation Set Ratio(Validation Set 비율)

Validation Set Ratio은 Green 분류 도구, Red 분석 도구의 High Detail 모드에서만 사용됩니다.

Validation Set 비율은 트레이닝 set으로 지정된 이미지 중 validation set으로 사용될 이미지의 비율입니다. 트레이닝 버튼을 클릭할 때마다 트레이닝 set에서 설정된 비율 만큼을 랜덤하게 뽑아 validation set으로 사용합니다.

Note:

테스트 Set과 Validation Set의 차이는 validation set은 학습 과정에 관여하지만 테스트 set은 전혀 관여를 하지 않는다는 것입니다. 테스트 Set은 오직 학습이 다 끝난 뒤에 일반적인 데이터에 대해 좋은 성능을 보이는 모델을 선택할 때만 사용됩니다.

  • 예를 들면, validation set 없이 epoch횟수를 너무 크게 설정한 경우 training set에 대해서 오버피팅(overfitting)된 모델이 생성될 수 있습니다. 만일 높은 epoch 횟수를 설정하고 validation set 없이 트레이닝을 시작했다면, 오버피팅이 일어나더라도 학습이 끝나기 전까지 이를 알 수 있는 방법이 없습니다 이 경우, 결국 오버피팅된 모델이 최종 모델로 생성되게 됩니다.
  • 하지만 validation set을 설정하면, 학습이 진행되는 동안 트레이닝 set에서의 성능과 validation set에서의 성능을 비교하여 특정 시점 이후에서validation set의 성능이 지나치게 낮아질 경우 과적합이 발생했다고 판단할 수 있습니다. 그리고 전체 학습이 끝난 뒤, 과적합이 일어나기 전에 생성된 모델을 최종 모델로 선택할 수 있습니다.

  • 이렇게 Validation Set은 학습 과정 중에 unseen data(보여지지 않은 데이터)에 대한 성능을 확인하여 모델을 보정하는데 관여합니다.