Herramienta de identificación Leer texto (OCRMax) - ficha Opciones avanzadasDefine cómo la herramienta debe combinar fragmentos de caracteres al formar éstos durante la segmentación: Requerir solapamiento (preajuste), Definir el espacio mínimo entre caracteres o Definir el espacio mínimo entre caracteres/máximo dentro de un carácter.
Define la fracción mínima (0 - 100; preajuste = 0) del solapamiento en la dirección X necesario entre dos fragmentos de un carácter para que dichos fragmentos sean considerados parte del mismo carácter.
Define el tamaño máximo, en píxeles (0 - 1000; preajuste = 5), del espacio que puede haber dentro de un carácter, incluso aunque esté dañado.
Define la separación mínima, en píxeles (0 - 1000; preajuste = 0), que puede haber entre dos caracteres. La separación se mide desde el borde derecho del rectángulo de un carácter hasta el borde izquierdo del rectángulo del siguiente carácter. Si la separación entre dos fragmentos no alcanza este valor, los fragmentos deben considerarse como parte del mismo carácter, a menos que el carácter combinado resulte escesivamente ancho (según especifican los parámetros Anchura máxima de los caracteres y/o Relación de aspecto mínima de los caracteres).
Define el número mínimo de los píxeles de primer plano (es decir, texto) (0 - 1000; preajuste = 15) que un fragmento debe tener para considerar su posible inclusión en un carácter. Un fragmento de carácter es un objeto binario grande ("blob") en la imagen binarizada.
Define el número mínimo de los píxeles de primer plano (es decir, texto) (0 - 5000; preajuste = 30) que un carácter debe tener para que sea comunicado.
Define el modo utilizado para normalizar la imagen: Ninguno, Global, Local o Local avanzado (preajuste).
Nota: Este ajuste debe ser idéntico tanto para el entrenamiento como para el tiempo de ejecución. Modificarlo después del entrenamiento puede causar problemas de clasificación.
Define si se deben eliminar o no de una imagen normalizada todos los elementos que no tengan la misma anchura de trazo que el resto de la imagen (por defecto, este ajuste está activado). Este ajuste resulta útil, por ejemplo, cuando los caracteres parecen estar interconectados por rayas finas de ruido. Sin embargo, con este ajuste también se pueden borrar caracteres reales indebidamente si las anchuras de trazos son irregulares.
Nota: Este ajuste debe ser idéntico tanto para el entrenamiento como para el tiempo de ejecución. Modificarlo después del entrenamiento puede causar problemas de clasificación.
Define si la función ignorará completamente los fragmentos que toquen cualquier borde de la región (por defecto, esta opción está desactivada). Ignorar esos fragmentos puede ser útil para objetos no textuales, como bordes de etiquetas, que puedan encontrarse dentro de la región.
Nota: Si un fragmento se extiende desde el borde del rectángulo de un carácter hasta la línea principal del texto, el fragmento será considerado como un carácter. Cuando este parámetro esté habilitado, el fragmento no deberá alcanzar la línea principal del texto que se desee excluir.
Define un modificador de porcentaje (0 - 100; preajuste = 50) en el rango utilizado para calcular en la imagen normalizada el umbral de binarización que binariza la imagen entre el primer plano y el fondo.
Define el contraste mínimo [en niveles de escala de grises de la imagen normalizada (0 - 255; preajuste = 30)] que un fragmento debe tener con respecto al umbral de binarización para que se considere su posible inclusión en un carácter.
Define la distancia, en píxeles (0 - 1000, preajuste = 0), que un fragmento puede desplazarse de la "línea principal" que atraviesa horizontalmente el texto.
Define el modo de análisis de caracteres a ejecutar para determinar la segmentación óptima de caracteres: Mínimo o Estándar (preajuste).
Define el paso mínimo, en píxeles (0 - 1000; preajuste = 0), que puede haber entre dos caracteres, calculado a partir del parámetro Espaciado de caracteres. Si el paso entre dos fragmentos es menor, éstos deben considerarse como parte del mismo carácter, a menos que el carácter combinado resulte escesivamente ancho (según especifican los parámetros Anchura máxima de los caracteres y/o Relación de aspecto mínima de los caracteres). Por "paso entre caracteres" se entiende la distancia entre puntos (aproximadamente) correspondientes de caracteres adyacentes, no como la distancia entre el final de un carácter y el comienzo del siguiente (denominada espaciado entre caracteres).
Define cómo se medirá el paso entre caracteres: Automático (preajuste) , izquierda a izquierda, centro a centro o derecha a derecha.
|
Notas: |
|
Define la métrica utilizada para definir el espaciado entre caracteres. Automático (preajuste), Fijo, Proporcional o Variable.
Nota: Si el parámetro Modo de análisis de segmentación se ajusta a Mínimo, este parámetro se desactivará.
Notas:
- Aunque ninguna medición del paso entre caracteres es constante a lo largo de una cadena, generalmente la separación entre caracteres, que es la distancia desde la parte derecha del rectángulo de un carácter hasta el lado izquierdo del rectángulo del carácter adyacente, es más o menos constante.
- Los términos "izquierda" y "derecha" se refieren al eje de coordenadas definido por la región, es decir, "derecha" equivale a la dirección X positiva.
Nota: Un paso entre caracteres Variable es diferente de Auto, ya que Auto asume que el campo es fijo o proporcional, pero que no es conocido.
Define si la herramienta ejecutará una validación de caracteres adicional durante la clasificación (por defecto, este parámetro está desactivado). Si se desactiva, la herramienta ejecutará una validación de caracteres adicional durante la clasificación, reduciendo las probabilidades de errores de lectura (es decir, las falsas aceptaciones de caracteres).
Define el tipo de imagen de salida que debería mostrarse: Imagen de entrada (preajuste), Imagen normalizada o Imagen binarizada.
Modo de combinación de fragmentos de caracteres