텍스트 읽기(OCRMax) 식별 도구 설정

텍스트 읽기(OCRMax) 식별 도구 트레이닝

첫 번째 트레이닝 영상을 로드합니다.
텍스트 읽기(OCRMax) 식별 도구를 작업에 추가합니다.
도구를 추가했으면 영상의 영역을 구성해야 합니다. 읽으려는 텍스트 라인 위에서 도구 영역의 위치를 지정합니다.

영역의 X축은 텍스트의 기준선과 평행이 되고 Y축은 문자의 세로 획과 평행이 되어야 합니다. 기울기가 없을 경우 Y축은 X축과 수직으로 됩니다.
X축의 플러스 방향이 읽기 방향에 해당합니다.
영역에는 읽으려는 텍스트 1개 라인과 그 주변을 둘러싼 몇몇 배경만 포함되어야 합니다. 배경에는 노이즈 및 상당한 배경 경사/음영이 있을 수 있습니다.
선명하게 인쇄되고 노이즈가 거의 없는 텍스트를 포함한 영상에서 영역이 텍스트 라인보다 훨씬 클 수 있습니다.
노이즈가 있는 영상의 경우 영역은 텍스트 라인 주변에서 비교적 탄탄하게 고정되어야 합니다.
경험에 근거한 대략적인 규칙에 따르면 영역은 가능한 경우 모든 면에서 문자 너비 절반 정도만큼 텍스트 라인보다 커야 합니다(예: 다른 기능이 영역 내에 둘어싸일 정도의 크기인 경계를 사용하지 않는 경우에 한 함).

참고 :

텍스트의 기준선은 영역이 대략 같은 각도를 향하는 한, 영상에 모든 각(0-360)을 포함할 수 있습니다.
영역에는 텍스트 라인 외에, 영상 내 일체 다른 유의한 형상이 포함되어서는 안 됩니다. 예를 들어, 영역에는 인접 텍스트의 다른 라인이나 라벨의 경계 등이 부분적으로도 포함되어서는 안 됩니다.
영역이 곡선으로 되어 있으면 도구는 "곡선 영역 위치"라는 라벨과 함께 바른 출력 영역으로 영상을 자동으로 풀어나가게 됩니다. 라벨은 효과적인 표시를 위해 영상에 다시 위치할 수 있습니다.

도구는 세그먼트화 탭의 기본 설정에 따라 문자인 것으로 판별되는 "텍스트" 주위에 문자 영역을 자동으로 생성합니다.
이 기능을 통해 텍스트 주위에 문자 영역을 제대로 그려내지 못할 경우 다음과 같은 두 가지 방안이 있습니다.

자동 조정 대화 상자를 사용하여 텍스트 읽기(OCRMax) 식별 도구를 통해 최적의 세그먼트화 설정을 자동으로 계산할 수 있습니다. 자동 조정 대화 상자에서는 세그먼트화와 트레이닝 단계를 하나의 단계로 결합합니다. 자동 조정 대화 상자 항목의 지침에 따라 글꼴 데이터베이스를 성공적으로 세그먼트화하고 트레이닝할 수 있습니다.
세그먼트화 탭으로 이동하여 텍스트가 개별 문자 영역 내에 올바르게 둘러싸일 때까지 파라미터를 조정합니다. 세그먼트화 프로세스에 따라 트레이닝하기 전에 모든 문자를 영상 데이터베이스에 세그먼트화합니다.

참고 :

영상에 노이즈가 많고 읽기 힘든 텍스트가 있을 경우 고급 탭 파라미터를 사용하면 곤란한 상황에 처했을 때 도움을 받을 수 있습니다.
문자 간에 공백이 있을 경우 공백 탭으로 이동하여 공백을 보완하도록 파라미터를 조정합니다.

세그먼트화 이후 텍스트 읽기(OCRMax) 식별 도구 수동 트레이닝

텍스트가 세그먼트화되었으면 문자를 트레이닝하고 글꼴에 추가할 준비가 된 것입니다. 우선, 설정 탭으로 이동하여 글꼴 라이브러리 파라미터에서 글꼴을 선택하여 글꼴 데이터베이스를 선택합니다.

새로운 맞춤(Custom) 글꼴을 만들 경우 트레이닝 탭으로 이동하여 트레이닝할 정확한 텍스트 문자열을 입력한 다음 모두 트레이닝 버튼을 누릅니다. 문자가 추가되고 선택한 맞춤(Custom) 글꼴에 저장됩니다.

기존의 맞춤(Custom) 글꼴에 또 다른 문자를 추가하려면 트레이닝할 문자를 포함하고 있는 또 다른 영상을 촬상하거나 로드해야 합니다. 필요한 경우, 영역과 세그먼트화 파라미터를 재구성하여 문자가 제대로 세그먼트화되었는지 확인한 뒤 트레이닝 탭에서 신규 트레이닝 또는 선택한 항목 트레이닝 버튼을 누릅니다.

참고 : 맞춤(Custom) 글꼴은 트레이닝 탭에서 OCRMax 데이터 파일(*.ocm)로 내보내거나 가져올 수 있습니다.

사전 정의된 OCRA 또는 OCRB 글꼴을 사용할 경우 읽으려는 텍스트 위로 도구 영역을 위치시키기만 하면 도구는 정의한 세그먼트화 및 고급 파라미터 설정에 따라 영역 내에서 문자를 자동으로 세그먼트화하게 됩니다.

참고 : 사전 정의된 OCRA 또는 OCRB 글꼴은 편집할 수 없습니다.

런타임 작업(Run-Time Operation)

도구에 트레이닝된 글꼴 데이터베이스가 있다면 이 도구는 런타임 작업을 위한 준비가 된 것입니다.

도구의 런타임 검사 모드를 설정하여 도구가 해당 영역 내에서 단순히 텍스트를 읽을 것인지, 아니면 문자열을 읽고 올바른 문자열을 읽었는지 확인할 것인지 여부를 판별합니다.
런타임 중 In-Sight 비전 시스템은 온라인 상태로 두고 작업에서 정의한 대로 영상을 촬상합니다. 영상을 촬상할 때 영상의 텍스트 문자열은 세그먼트화 파라미터에 따라 자동으로 세그먼트화되고 문자는 트레이닝된 문자 인스턴스와 서로 비교됩니다.