텍스트 판독(OCRMax) 식별 도구 - 영역 분할 탭
영역 분할 탭은 영역 내 문자들을 분할하는 설정을 조정 및 수정하는 데 사용합니다. 보통, 기본값과 설정으로 대부분의 텍스트를 판독할 수 있으나, 간혹 판독이 쉽지 않아 일부 파라미터 값을 조정해야 하는 경우가 있습니다. 이 경우, 대개 최소 문자 폭, 최대 문자 폭 및/또는 최소 피치(즉, 문자 간 거리, 예를 들어 한 문자의 왼쪽 경계부터 다음에 오는 문자의 왼쪽 경계까지의 거리)를 지정하면 문제가 해결됩니다. 다른 경우에서와 폰트 데이터베이스 생성을 빠르게 하기 위해서, 자동 조정버튼을 이용해서 자동 조정 대화상자를 열고 최적 영역 설정을 자동 계산하도록 합니다.
- 영상에 텍스처가 강력한 배경이 담겨 있고 및/또는 노이즈가 지나치게 많아서 문자가 배경에 섞여 들어가는 경우 분할이 어렵습니다.
- 영역에는 판독 대상 문자만 포함되어 있어야 하며, 다른 문자나 라벨 경계 등 강력한 외부적 요소는 일체 없어야 합니다.
- 문자 2개가 서로 닿는 경우 대개는 파라미터를 조정해 주셔야 합니다. 고정폭 문자들이 서로 닿는 경우 문자폭을 지정해 보정하면 됩니다. 하지만 비례적 글꼴로된 문자가 서로 닿는 경우 함수가 올바로 처리하는 경우도 있지만 그렇지 않은 경우도 있어 문제가 될 수 있습니다.
- 짧은 라인 텍스트(예를 들어, 문자 수 3개 이하), 또는 비교적 짧은 라인에 라인 지터가 많은 경우, 예상 각도 범위를 지정해 주면 함수가 짧은 라인 텍스트의 방향을 결정하는 데 있어 내재적 불확실성을 적절하게 보정하는 데 도움이 됩니다.
- 한 라인에 들어 있는 문자들은 모두 반드시 방향과 왜도가 동일해야 합니다.
- 효과적으로 분리된 도트 매트릭스 출력물(예: 도트들이 서로 닿지 않는)의 경우 문자들을 올바르게 분할하려면 최소 문자 조각 크기와 같은 파라미터의 조정이 필요할 수 있습니다.
- 문자 스트로크 폭은 반드시 2픽셀 또는 그 이상이어야 합니다.
- 큰 문자(보통 알파벳-숫자)의 경우 최소 문자 크기는 8 x 8 픽셀입니다. 작은 문자(온점 등)의 최소 문자 크기는 2 x 2 픽셀입니다.
자동 조정 모델을 생성하는 자동 조정 레코드 구성을 통해 영역분할 매개변수를 구성하고 폰트 데이터베이스를 트레이닝하기 위해서는 텍스트 판독 (OCRMax) 식별 도구에 연결된 자동 조정 대화상자를 실행시킵니다. 자동 조정 레코드는 이미지, 트레이닝 문자열, 이미지 안에 있는 문자에 대해 사용자가 승인한 위치가 들어있습니다. 자동 조정 모델은 하나 이상의 자동 조정 레코드 내 모든 이미지의 최고 세그먼트와 자동 조정 레코드로 구성됩니다.
- 자동 조정 대화상자를 이용할 때 In-Sight 비전 시스템 대신 In-Sight E 에뮬레이터에서 영역 분할 조정을 실행할 것을 권장합니다. 텍스트 판독 (OCRMax) 도구의 자동 조정 알고리즘에는 많은 양의 컴퓨터 관련 정보가 필요하며, 비전 시스템보다는 에뮬레이터에서 더 뛰어난 성능을 보입니다.
- 폰트 데이터베이스를 트레이닝하고 자동 조정 대화상자를 이용해서 문자를 분할할 때 가장 좋은 이미지부터 시작해서 가장 나쁜 이미지 순서로 문자가 가장 잘 표시되는 이미지 (예: 가장 좋은 이미지 먼저)를 이용해서 프로세서를 시작할 것을 권장합니다. 이렇게 하면 텍스트 판독 (OCRMax) 도구의 자동 조정 알고리즘 조정이 성공적으로 이루어집니다.
입력 영상에서 문자의 극성을 정의합니다: 흰색 바탕에 검은색, 검은색 바탕에 흰색 또는 자동(기본값).
- 흰색 바탕에 검은색: 텍스트의 극성은 흰색 바탕에 검은색 텍스트입니다.
- 검은색 바탕에 흰색: 텍스트의 극성은 검은색 바탕에 흰색 텍스트입니다.
- 자동: 도구가 텍스트와 배경의 극성을 자동으로 결정합니다.
해당 글꼴 문자들의 폭이 어떻게 변동되는지를 정의합니다: 자동(기본값), 고정 또는 가변.
- 자동: 문자 폭이 알려지지 않은 상태입니다. 해당 글꼴은 폭이 고정일 수도 있고 비례일 수도 있습니다.
- 고정: 모든 글꼴의 문자 사각형은 폭이 모두 동일합니다.
- 가변: 글꼴 문자의 문자 사각형 폭이 각기 다를 수 있습니다.
보고 대상이 되려면 문자가 가져야 하는 문자의 문자 사각형 최소 폭을 픽셀(1 - 1000; 기본값 = 3) 단위로 정의합니다.
보고 대상이 되려면 문자가 가져야 하는 문자의 문자 사각형 최소 높이를 픽셀(1 - 1000; 기본값 = 3) 단위로 정의합니다.
도구가 문자의 문자 사각형 최대 허용 폭을 고려해야 할지 여부를 정의합니다(기본 설정상, 이 파라미터는 비활성 상태입니다).
보고 대상이 되려면 문자가 가져야 하는 문자의 문자 사각형 최대 폭을 픽셀(1 - 5000; 기본값 = 100) 단위로 정의합니다.
도구가 문자의 문자 사각형 최대 허용 높이를 고려해야 할지 여부를 정의합니다(기본 설정상, 이 파라미터는 비활성 상태입니다).
보고 대상이 되려면 문자가 가져야 하는 문자의 문자 사각형 최대 높이를 픽셀(1 - 5000; 기본값 = 100) 단위로 정의합니다.
함수가 문자에 대해 최소 허용 종횡비를 감안해야 할지 여부를 정의합니다. 여기서 종횡비는 전체 문자 라인의 높이를 문자의 문자 사각형 폭으로 나눈 수를 말합니다(기본 설정상, 이 파라미터는 활성 상태입니다).
문자의 최소 허용 종횡비(0-500; 기본값 = 80)를 정의합니다.
각도 검색 범위(0 - 45; 기본값 = 0)를 도 단위로 정의합니다.
왜도 검색 범위(0 - 45; 기본값 = 0)를 도 단위로 정의합니다.
이미지에 그래픽 진단 데이타의 표시 여부를 정의합니다. 활성화 되면 유지된 문자(녹색), 거부된 문자(빨간색), 유지된 조각(청록색), 거부된 조각(노란색), 텍스트 기준선(파란색), 텍스트 확장 기준선(자주색) 주변에 영역이 표시됩니다.