Configuración de la herramienta de identificación Leer Texto (OCRMax)

Entrenamiento de la herramienta de identificación Leer Texto (OCRMax)

Cargue la primera imagen a entrenar.
Añada la herramienta de identificación Leer texto (OCRMax) al trabajo.
Una vez añadida la herramienta, deberá configurar la región en la imagen. Sitúe la región de la herramienta sobre la línea de texto a leer:

El eje X de la región debe ser paralelo a la línea base del texto, mientras que el eje Y debe ser paralelo a los trazos verticales de los caracteres; en ausencia de inclinación, el eje Y será perpendicular al eje X.
La dirección positiva del eje X corresponde a la dirección de lectura.
La región solo debe contener una línea de texto para leer y algo de fondo circundante. El fondo puede ser ruidoso y contener gradientes o sombreados significativos.
En imágenes con texto claramente impresas y con poco ruido, la región puede ser significativamente mayor que la línea de texto.
En imágenes ruidosas, la región debería estar relativamente ajustada a la línea de texto.
Como regla aproximada, a ser posible, la región debe superar en anchura por todos los lados a la línea de texto en al menos la mitad del ancho de caracteres (salvo que un borde fuese tan grande que abarcase otras características dentro de la región).
Note:
- La línea base del texto puede contener cualquier ángulo (0-360) en la imagen, siempre que la región esté aproximadamente orientada al mismo ángulo.
- La región no debería contener ningún otro elemento significativo de la imagen, salvo la línea de texto. Por ejemplo, la región no debería contener parcialmente una línea diferente de texto cercano ni el borde de una etiqueta.
- Si la región está curvada, la herramienta desenvolverá automáticamente la imagen en una región de salida enderezada con una etiqueta "Posición de la región curvada", que puede recolocarse en la imagen con fines de visualización.
La herramienta creará automáticamente regiones de caracteres alrededor del "texto" que detecte como caracteres basándose en los ajustes predeterminados de la ficha Segmentación.
Si la función no dibuja correctamente las regiones de los caracteres alrededor del texto, existen dos alternativas:
- Utilice el diálogo Sintonización automática y deje que la herramienta de identificación Leer texto (OCRMax) calcule automáticamente los ajustes de segmentación óptimos. El diálogo Sintonización automática combina las fases de segmentación y entrenamiento en un único paso. Para segmentar y entrenar correctamente una base de datos de tipos de letra, siga las instrucciones del diálogo Sintonización automática.
- Abra la ficha Segmentación y ajuste los parámetros hasta que el texto quede correctamente encerrado dentro de las regiones de caracteres individuales. Ejecute el proceso de segmentación para segmentar correctamente todos los caracteres de la base de datos de imágenes antes del entrenamiento.
Note:
- Para imágenes ruidosas en las que resulte difícil leer el texto, los parámetros de la ficha Avanzados pueden resultar útiles para compensar las condiciones difíciles.
- Si hay espacios entre caracteres, abra la ficha Espacios y ajuste los parámetros para compensar dichos espacios.

Entrenamiento manual de la herramienta de identificación Leer Texto (OCRMax) después de la segmentación

Una vez segmentado el texto, los caracteres están listos para ser entrenados y añadidos al tipo de letra. Primero, seleccione una base de datos de fuentes en la ficha Ajustes y seleccione una fuente en el parámetro Biblioteca de fuentes.

Si está creando una nueva fuente Personalizada, abra la ficha Entrenamiento, introduzca la cadena de texto exacta que desee entrenar y presione el botón Entrenar todos. Los caracteres se añadirán y almacenarán en la fuente personalizada seleccionada.

Para añadir caracteres adicionales a una fuente personalizada ya existente, adquiera o cargue otra imagen que contenga los caracteres a entrenar. Si fuese necesario, vuelva a configurar la región y los parámetros Segmentación para asegurarse de que los caracteres sean segmentados correctamente, y luego presione los botones Entrenar nuevos o Entrenar seleccionados en la ficha Entrenamiento.

Note: Las fuentes personalizadas se pueden exportar o importar como archivos de datos OCRMax (*.ocm) desde la ficha Entrenamiento.
Si está utilizando una fuente predefinida OCRA o OCRB, simplemente sitúe la región de la herramienta sobre el texto a leer, y la herramienta segmentará automáticamente los caracteres contenidos en la región basándose en ajustes de los parámetros Segmentación y Avanzado.

Note: Las fuentes predefinidas OCRA y OCRB no son editables.

Funcionamiento en tiempo de ejecución

Cuando la herramienta disponga de una base de datos de tipos de letra entrenados, estará lista para pasar al tiempo de ejecución.

Ajuste el Modo de inspección en tiempo de ejecución de la herramienta, que determina si la herramienta se limitará a leer texto dentro de su región o si debe leer y verificar si se ha leído la cadena correcta.
En tiempo de ejecución, el sistema de visión In-Sight se pondrá en línea y adquirirá imágenes según se haya definido en la tarea. En el momento de adquirir una imagen, la cadena de texto de la imagen se segmenta automáticamente de acuerdo con los parámetros de segmentación y los caracteres se comparan con sus muestras entrenadas.