샘플링 매개변수 설정
다른 도구들과 달리, Blue 읽기 도구를 사용할 때에는 각 뷰에 라벨링을 하기 전에 샘플링 매개변수를 먼저 설정해야 합니다. 이는 이 매개변수들이 문자 feature 라벨 크기에 영향을 미치기 때문입니다.
샘플링 매개변수 설정
Feature란 이미지 데이터에서 사용자가 중요하게 생각하는 픽셀, 혹은 사용자의 머신 비전 문제를 해결하여 특정한 목적을 달성하는 데 핵심적인 픽셀입니다. 예를 들어, Blue 읽기 도구에서 feature는 뷰에 있는 어떤 알파벳 또는 숫자 문자열을 표현하는 픽셀일 수 있습니다.
Feature 샘플링 원리
Green 분류 도구의 Focused 모드, Red 분석 도구의 Focused 모드, Blue 위치 그리고 Blue 읽기 도구는 도구는 입력 이미지를 균일하게 샘플링하지 않습니다 (이미지 샘플링이 전체 이미지 범위를 포함하더라도). 트레이닝 중에는 이 도구들이 특별한 기법을 이용해, 네트워크에 추가적인 정보를 기여할 가능성이 크다고 판단된 이미지의 부분을 더 높은 비율로 샘플링합니다.
샘플 영역 주위의 정보 및 context 정보를 모두 이용해 네트워크 트레이닝을 수행하므로, 도구는 이미지의 가장자리에서 수집된 샘플에 큰 영향을 받을 수 있습니다. 이미지 내의 뷰를 이용할 경우, 뷰의 가장자리에서 수집된 샘플에 대한 context 정보는, 뷰 외부의 픽셀을 context 데이터로 이용할 것입니다.
|
|
|
|
|
1 |
Feature Size(Feature 크기) |
|
|
2 |
Sample Region(샘플 영역) |
|
|
3 |
Context Region(Context 영역) |
|
샘플이 이미지 자체의 가장자리에 있다면, 도구는 context로 이용할 합성 픽셀을 생성합니다. 사용자는 마스크, 경계, 샘플 컬러 채널(각각 경계 유형, 컬러 이용)을 이용해 여기 이용되는 구체적인 방법을 제어할 수 있습니다.
또한 도구들을 쓸 때 샘플링 시 마스크를 적용할 수도 있습니다. 마스크 처리된 영역이 context로 프로세싱되는 경우라도, 사용자는 이를 통해 이미지의 일부를 명시적으로 제외할 수 있습니다.
마지막으로, 컬러 이미지(또는 다수의 평면 또는 채널이 있는 이미지)를 이용하는 경우, 어떤 채널을 샘플링할지 명시적으로 지정할 수 있습니다. 다수 채널을 사용하는 것은 트레이닝 및 프로세싱 시간에 큰 영향을 미치지 않지만, 컬러가 이미지에서 중요한 정보를 제공하는 경우 도구의 정확도를 높이는 데 도움이 됩니다.
샘플링 매개변수
Focused 모드 도구를 효과적으로 트레이닝하려면 Feature들이 어떤 모습, 속성을 띄는지 최대한 상세한 내용을 도구에 제공해야 합니다. 이는 샘플링 매개변수를 설정함으로 이루어집니다. Focused 도구는 뷰에서 픽셀 정보를 샘플링하는 특징 샘플러를 사용하며, 샘플링 매개변수를 설정하면 이 특징 샘플러에 샘플링해야 할 또는 하지 말아야 할 feature들 속성을 알려줄 수 있습니다.
샘플링 도구 매개변수는 트레이닝과 프로세싱 시 이미지를 샘플링하는 방법을 제어합니다.
| 매개변수 | 설명 |
|---|---|
|
Feature Size(Feature 크기) |
전형적인 feature의 지름을 픽셀 단위로 지정합니다. Feature 크기 매개변수는 이미지의 좌측 하단에 그래픽으로 표시되며, 이미지 내에서 그래픽을 이용해 크기를 변경할 수 있어 더 정확한 크기를 지정할 수 있습니다. Feature 크기는 프로세싱 시간(n2)에 큰 영향을 미칩니다. Feature 크기가 100이면 10일 때에 비해 100배 빠르며, 15 이하의 feature 크기는 대개 좋은 결과를 얻지 못합니다. Feature 크기를 설정할 때, 프로세싱 시간(Ptime)에 대해 다음을 고려하십시오.
Note:
|
|
Polarity(원본/반전) |
Blue 읽기 도구는 일관된 텍스트 및 배경 polarity를 가진 이미지 세트, 예를 들어 밝은 배경의 어두운 텍스트에 대해 사전 트레이닝 되었으며 반대로 polarity가 있는 이미지 데이터 세트가있는 경우 Polarity 드롭 다운 메뉴에서 polarity(원본/반전)를 선택하여 polarity를 선택하십시오.
이 매개변수가 반전으로 설정되면, 이미지 디스플레이의 이미지와 메인 디스플레이의 이미지 모두 polarity가 변경되어 표시됩니다. Note: 이러한 polarity의 변화는 Blue 읽기 도구에만 적용되며, 후속의 모든 도구는 원래의 이미지 회색조 polarity를 유지합니다.
|
|
Border Type(경계 유형) |
이미지 외부의 픽셀을 어떻게 샘플링할지 지정합니다. Tip: 이미지의 경계에 추가 마스크를 추가하면 오류 검출률이 크게 낮아집니다.
|
|
Masking Mode(마스킹 모드) |
샘플링된 이미지에 마스크를 어떻게 적용할지 지정합니다. 마스크는 도구가 처리하는 영역을 제한하기 위해 이용됩니다. Note: 마스크는 트레이닝 이후에 설정해도 되지만, 트레이닝 이전에 설정하면 학습 단계에 도움이 됩니다.
|
샘플링 매개변수 상세 정보: Feature 샘플링과 Feature 크기
Green 분류 도구의 Focused 모드, Red 분석 도구 Focused 모드, Blue 위치 그리고 Blue 읽기 도구는 사용자가 지정한 feature 크기에 의해 이미지를 분석합니다. 픽셀 단위로 지정되는 feature 크기는 input 이미지 안에 있는, "의미 있는" 또는 "독특한" feature의 크기 기대치에 대한 힌트를 도구에 줍니다. Feature 크기를 선택하는 최선의 방법은 인간 검사자인 것처럼 input 이미지를 검토하는 것입니다. 이미지 안의 feature는 이미지가 정상인지 불량인지 특징 짓기 위해, 또는 결함 또는 문제를 식별하거나, 어디에 무엇이 있고 그것이 무엇인지 결정하기 위해 이용한다는 점에 유념하십시오.
예를 들어, 항공기 그림을 엔진 수에 기초해 분류하고자 한다면, feature 크기는 항공기 엔진의 대략적인 크기에 기초하게 될 것입니다.
트레이닝과 런타임 모두, 해당 도구는 이미지 내 하부 영역의 픽셀과 해당 영역 주위의 context 정보에 부합하는 샘플을 이미지에서 수집할 것입니다. Context 영역은 대략 feature 크기의 5배입니다.
|
|
|
|
1 |
Feature Size(Feature 크기) |
|
2 |
샘플 영역 |
|
3 |
Context Region(Context 영역) |
Feature 크기 지정은 주관적 판단이지만, 몇 가지 구체적인 지침이 있습니다. Blue 읽기 도구의 경우, feature 크기는 대략적으로 전형적인 "A" 또는 "E" 문자를 포함하는 사각형의 크기와 같아야 합니다.
샘플링 매개변수 상세 정보: Feature 크기 조정
이 도구는 일반적인 문자 크기로 트레이닝되었으므로, 사용자는 먼저 도구의 feature 크기 매개변수를 조정해 이 도구가 적용해야 하는 이미지 안의 문자 크기와 일치시켜야 합니다. 도구의 feature 크기 표시상자가 이미지의 좌측 하단 모서리에 표시됩니다(아래 참조).
이 표시상자는 이미지 내에서 끌 수 있어, 이미지 내의 feature에 기초해 크기를 정할 수 있습니다. 나아가, 이 표시상자는 크기 변경 핸들(표시기 위로 마우스를 가져가면)을 끌어 크기를 변경할 수 있습니다. 표시상자 크기를 변경하면, feature 크기 매개변수도 변경됩니다.
샘플링 매개변수 상세 정보: 학습 이전에, 미리 학습된 신경망으로 이미지 프로세싱
새로운 Blue 읽기 도구를 생성할 때, 도구는 문자열 인식을 위해 미리 학습된 신경망을 사용하기 때문에 이미 이미지에서 문자를 발견해 보고할 준비가 되어 있습니다. 사용자는 feature 크기 매개변수를 이용해 이미지 내의 ROI와 문자 크기만을 지정하면 됩니다. 이렇게 하고 나면 바로 단일 이미지(이미지에서 마우스 우클릭한 후 메뉴에서 프로세싱 선택) 또는 전체 트레이닝 Set(책 아이콘 클릭)를 프로세싱할 수 있습니다.
Blue 읽기 도구는 문자 주위에 노란색 상자를 그려 발견한 문자를 나타내며, 해독된 문자 값(라벨)은 모서리에 표시됩니다. Blue 읽기 도구는 이를 "feature"라고 부릅니다.
사용자는 이미지에서 하나 이상의 feature를 클릭하여 선택할 수 있고, SHIFT 키를 누른 상태에서 클릭하여 feature를 추가할 수 있고, SHIFT 키를 누른 상태에서 영역 위로 마우스를 끌어 다수의 feature를 선택할 수 있습니다. 선택된 feature는 그래픽 주변의 경계가 두껍게 표시됩니다.
Feature는 사용자가 문자가 있을 것이라고 생각하는 곳이 아니라, 도구가 문자를 찾은 곳이므로, feature는 이동할 수 없습니다. Feature를 삭제(feature를 마우스 우클릭한 후 메뉴에서 feature 삭제 선택)할 수는 있지만, 이는 도구에 영향을 주지 않습니다. 다음에 해당 이미지를 프로세싱하면, 이 feature가 다시 나옵니다.