샘플링 매개변수 설정

다른 도구들과 달리, Blue 읽기 도구를 사용할 때에는 각 뷰에 라벨링을 하기 전에 샘플링 매개변수를 먼저 설정해야 합니다. 이는 이 매개변수들이 문자 feature 라벨 크기에 영향을 미치기 때문입니다.

샘플링 매개변수 설정

Feature란 이미지 데이터에서 사용자가 중요하게 생각하는 픽셀, 혹은 사용자의 머신 비전 문제를 해결하여 특정한 목적을 달성하는 데 핵심적인 픽셀입니다. 예를 들어, Blue 읽기 도구에서 feature는 뷰에 있는 어떤 알파벳 또는 숫자 문자열을 표현하는 픽셀일 수 있습니다.

Feature 샘플링 원리

Green 분류 도구의 Focused 모드, Red 분석 도구의 Focused 모드, Blue 위치 그리고 Blue 읽기 도구는 도구는 입력 이미지를 균일하게 샘플링하지 않습니다 (이미지 샘플링이 전체 이미지 범위를 포함하더라도). 트레이닝 중에는 이 도구들이 특별한 기법을 이용해, 네트워크에 추가적인 정보를 기여할 가능성이 크다고 판단된 이미지의 부분을 더 높은 비율로 샘플링합니다.

샘플 영역 주위의 정보 및 context 정보를 모두 이용해 네트워크 트레이닝을 수행하므로, 도구는 이미지의 가장자리에서 수집된 샘플에 큰 영향을 받을 수 있습니다. 이미지 내의 뷰를 이용할 경우, 뷰의 가장자리에서 수집된 샘플에 대한 context 정보는, 뷰 외부의 픽셀을 context 데이터로 이용할 것입니다.


1	Feature Size(Feature 크기)
2	Sample Region(샘플 영역)
3	Context Region(Context 영역)

샘플이 이미지 자체의 가장자리에 있다면, 도구는 context로 이용할 합성 픽셀을 생성합니다. 사용자는 마스크, 경계, 샘플 컬러 채널(각각 경계 유형, 컬러 이용)을 이용해 여기 이용되는 구체적인 방법을 제어할 수 있습니다.

또한 도구들을 쓸 때 샘플링 시 마스크를 적용할 수도 있습니다. 마스크 처리된 영역이 context로 프로세싱되는 경우라도, 사용자는 이를 통해 이미지의 일부를 명시적으로 제외할 수 있습니다.

마지막으로, 컬러 이미지(또는 다수의 평면 또는 채널이 있는 이미지)를 이용하는 경우, 어떤 채널을 샘플링할지 명시적으로 지정할 수 있습니다. 다수 채널을 사용하는 것은 트레이닝 및 프로세싱 시간에 큰 영향을 미치지 않지만, 컬러가 이미지에서 중요한 정보를 제공하는 경우 도구의 정확도를 높이는 데 도움이 됩니다.

Note: 다음 방법을 통해 이미지 경계를 처리하기위한 대체 방법으로 마스킹 모드 매개변수를 사용할 수 있습니다. 이미지의 경계를 마스킹하면 도구가 컨텍스트에 대해 합성 픽셀 생성이 필요한 이미지 샘플을 수집하지 않도록 할 수 있습니다.

샘플링 매개변수

Focused 모드 도구를 효과적으로 트레이닝하려면 Feature들이 어떤 모습, 속성을 띄는지 최대한 상세한 내용을 도구에 제공해야 합니다. 이는 샘플링 매개변수를 설정함으로 이루어집니다. Focused 도구는 뷰에서 픽셀 정보를 샘플링하는 특징 샘플러를 사용하며, 샘플링 매개변수를 설정하면 이 특징 샘플러에 샘플링해야 할 또는 하지 말아야 할 feature들 속성을 알려줄 수 있습니다.

Note: 샘플링 매개변수들은 트레이닝 결과에 영향을 미치므로 다른 트레이닝 매개변수들(네트워크 모델 매개변수, 트레이닝 매개변수, 변화 매개변수)들과 함께 트레이닝 시작 전에 설정되어야 합니다.

Note: High Detail과 High Detail Quick 아키텍처 기반 도구들은 feature 설정이 필요하지 않는데, 이는 이 도구들이 뷰 전체에서 픽셀 정보를 샘플링하기 때문입니다. 따라서 이들은 샘플링 매개변수로 설정하는 특징 샘플러가 필요하지 않습니다.

샘플링 도구 매개변수는 트레이닝과 프로세싱 시 이미지를 샘플링하는 방법을 제어합니다.

매개변수	설명
Feature Size(Feature 크기)	전형적인 feature의 지름을 픽셀 단위로 지정합니다. Feature 크기 매개변수는 이미지의 좌측 하단에 그래픽으로 표시되며, 이미지 내에서 그래픽을 이용해 크기를 변경할 수 있어 더 정확한 크기를 지정할 수 있습니다. Feature 크기는 프로세싱 시간(n2)에 큰 영향을 미칩니다. Feature 크기가 10⁰이면 10일 때에 비해 100배 빠르며, 15 이하의 feature 크기는 대개 좋은 결과를 얻지 못합니다. Feature 크기를 설정할 때, 프로세싱 시간(P_time)에 대해 다음을 고려하십시오. Note: 도구는 실제로 feature 크기 설정의 5배 크기인 영역을 봅니다. 하지만, feature의 중심부는 주변부에 비해 상세화 정도가 매우 높습니다. Blue 읽기 도구의 경우 feature 크기는 폭 x 높이의 2차원입니다.
Polarity(원본/반전)	Blue 읽기 도구는 일관된 텍스트 및 배경 polarity를 가진 이미지 세트, 예를 들어 밝은 배경의 어두운 텍스트에 대해 사전 트레이닝 되었으며 반대로 polarity가 있는 이미지 데이터 세트가있는 경우 Polarity 드롭 다운 메뉴에서 polarity(원본/반전)를 선택하여 polarity를 선택하십시오. 이 매개변수가 반전으로 설정되면, 이미지 디스플레이의 이미지와 메인 디스플레이의 이미지 모두 polarity가 변경되어 표시됩니다. Note: 이러한 polarity의 변화는 Blue 읽기 도구에만 적용되며, 후속의 모든 도구는 원래의 이미지 회색조 polarity를 유지합니다.
Border Type(경계 유형)	이미지 외부의 픽셀을 어떻게 샘플링할지 지정합니다. Tip: 이미지의 경계에 추가 마스크를 추가하면 오류 검출률이 크게 낮아집니다. Black:이미지 외부를 단색(검은색)으로 채웁니다. Replicate: 마지막 픽셀로 이미지 외부를 채웁니다.
Masking Mode(마스킹 모드)	샘플링된 이미지에 마스크를 어떻게 적용할지 지정합니다. 마스크는 도구가 처리하는 영역을 제한하기 위해 이용됩니다. Note: 마스크는 트레이닝 이후에 설정해도 되지만, 트레이닝 이전에 설정하면 학습 단계에 도움이 됩니다. Transparent: 샘플은 이미지 중 마스킹되지 않은 부분에서만 수집되지만, context 영역의 데이터는 마스킹된 부분에서도 수집됩니다. 이렇게 함으로써 마스크나 ROI의 경계에 있는 feature나 결함이 중심에 위치한 feature 또는 결함과 동일한 응답을 가져오게 됩니다. Mask:마스크를 이용하면 마스킹된 영역을 무시하게 됩니다. 마스킹된 픽셀은 모두 0으로 설정되어, 트레이닝 또는 런타임 중 이미지에서 마스킹된 부분의 데이터는 고려되지 않습니다. 하지만, 동시에 마스크 경계에 가까운 결함 또는 feature에 대한 도구의 반응이 달라집니다. 이 설정은 도구가 ROI의 중심에 집중하게 할 때도 이용됩니다. Overlay: 추가적인 컬러 채널로 샘플 이미지에 마스크를 적용합니다.

Note: 도구가 트레이닝된 후 샘플링 매개변수를 변경하면, 기반이 되는 이미지 통계량이 근본적으로 변할 수 있어 트레이닝이 무효로 되며, 도구를 다시 트레이닝해야 합니다.

샘플링 매개변수 상세 정보: Feature 샘플링과 Feature 크기

Green 분류 도구의 Focused 모드, Red 분석 도구 Focused 모드, Blue 위치 그리고 Blue 읽기 도구는 사용자가 지정한 feature 크기에 의해 이미지를 분석합니다. 픽셀 단위로 지정되는 feature 크기는 input 이미지 안에 있는, "의미 있는" 또는 "독특한" feature의 크기 기대치에 대한 힌트를 도구에 줍니다. Feature 크기를 선택하는 최선의 방법은 인간 검사자인 것처럼 input 이미지를 검토하는 것입니다. 이미지 안의 feature는 이미지가 정상인지 불량인지 특징 짓기 위해, 또는 결함 또는 문제를 식별하거나, 어디에 무엇이 있고 그것이 무엇인지 결정하기 위해 이용한다는 점에 유념하십시오.

예를 들어, 항공기 그림을 엔진 수에 기초해 분류하고자 한다면, feature 크기는 항공기 엔진의 대략적인 크기에 기초하게 될 것입니다.

트레이닝과 런타임 모두, 해당 도구는 이미지 내 하부 영역의 픽셀과 해당 영역 주위의 context 정보에 부합하는 샘플을 이미지에서 수집할 것입니다. Context 영역은 대략 feature 크기의 5배입니다.


1	Feature Size(Feature 크기)
2	샘플 영역
3	Context Region(Context 영역)

Feature 크기 지정은 주관적 판단이지만, 몇 가지 구체적인 지침이 있습니다. Blue 읽기 도구의 경우, feature 크기는 대략적으로 전형적인 "A" 또는 "E" 문자를 포함하는 사각형의 크기와 같아야 합니다.

Note: Feature 크기와 도구 학습/프로세싱 속도와의 관계에 대한 자세한 내용은 Feature 크기 최적화 항목을 확인하십시오.

샘플링 매개변수 상세 정보: Feature 크기 조정

이 도구는 일반적인 문자 크기로 트레이닝되었으므로, 사용자는 먼저 도구의 feature 크기 매개변수를 조정해 이 도구가 적용해야 하는 이미지 안의 문자 크기와 일치시켜야 합니다. 도구의 feature 크기 표시상자가 이미지의 좌측 하단 모서리에 표시됩니다(아래 참조).

이 표시상자는 이미지 내에서 끌 수 있어, 이미지 내의 feature에 기초해 크기를 정할 수 있습니다. 나아가, 이 표시상자는 크기 변경 핸들(표시기 위로 마우스를 가져가면)을 끌어 크기를 변경할 수 있습니다. 표시상자 크기를 변경하면, feature 크기 매개변수도 변경됩니다.

Note: 다른 도구와 달리, Blue 읽기 도구는 feature 크기를 변경해도 자동으로 재설정되지 않습니다.

샘플링 매개변수 상세 정보: 학습 이전에, 미리 학습된 신경망으로 이미지 프로세싱

새로운 Blue 읽기 도구를 생성할 때, 도구는 문자열 인식을 위해 미리 학습된 신경망을 사용하기 때문에 이미 이미지에서 문자를 발견해 보고할 준비가 되어 있습니다. 사용자는 feature 크기 매개변수를 이용해 이미지 내의 ROI와 문자 크기만을 지정하면 됩니다. 이렇게 하고 나면 바로 단일 이미지(이미지에서 마우스 우클릭한 후 메뉴에서 프로세싱 선택) 또는 전체 트레이닝 Set(책 아이콘 클릭)를 프로세싱할 수 있습니다.

Blue 읽기 도구는 문자 주위에 노란색 상자를 그려 발견한 문자를 나타내며, 해독된 문자 값(라벨)은 모서리에 표시됩니다. Blue 읽기 도구는 이를 "feature"라고 부릅니다.

사용자는 이미지에서 하나 이상의 feature를 클릭하여 선택할 수 있고, SHIFT 키를 누른 상태에서 클릭하여 feature를 추가할 수 있고, SHIFT 키를 누른 상태에서 영역 위로 마우스를 끌어 다수의 feature를 선택할 수 있습니다. 선택된 feature는 그래픽 주변의 경계가 두껍게 표시됩니다.

Feature는 사용자가 문자가 있을 것이라고 생각하는 곳이 아니라, 도구가 문자를 찾은 곳이므로, feature는 이동할 수 없습니다. Feature를 삭제(feature를 마우스 우클릭한 후 메뉴에서 feature 삭제 선택)할 수는 있지만, 이는 도구에 영향을 주지 않습니다. 다음에 해당 이미지를 프로세싱하면, 이 feature가 다시 나옵니다.