Herramienta de identificación Leer texto (OCRMax) - ficha Opciones avanzadas
Define cómo la herramienta debe combinar fragmentos de caracteres al formar éstos durante la segmentación: Requerir solapamiento (preajuste), Definir el espacio mínimo entre caracteres o Definir el espacio mínimo entre caracteres/máximo dentro de un carácter.
- Requerir solapamiento: Para poder combinarlos, los fragmentos de caracteres deben solaparse horizontalmente en al menos un píxel.
- Definir el espacio mínimo entre caracteres: Los fragmentos de caracteres separados entre sí horizontalmente se pueden combinar para formar caracteres. Se combinarán cualesquiera dos fragmentos cuya separación sea inferior al valor definido en el parámetro "Espacio mínimo entre caracteres".
- Definir el espacio mínimo entre caracteres/máximo dentro de un carácter: Los fragmentos de caracteres separados entre sí horizontalmente se pueden combinar para formar caracteres. La decisión de fusionar dos fragmentos se basará en los valores definidos en los parámetros Espacio mínimo entre caracteres y Espacio máximo dentro de un carácter.
Define la fracción mínima (0 - 100; preajuste = 0) del solapamiento en la dirección X necesario entre dos fragmentos de un carácter para que dichos fragmentos sean considerados parte del mismo carácter.
Define el tamaño máximo, en píxeles (0 - 1000; preajuste = 5), del espacio que puede haber dentro de un carácter, incluso aunque esté dañado.
Define la separación mínima, en píxeles (0 - 1000; preajuste = 0), que puede haber entre dos caracteres. La separación se mide desde el borde derecho del rectángulo de un carácter hasta el borde izquierdo del rectángulo del siguiente carácter. Si la separación entre dos fragmentos no alcanza este valor, los fragmentos deben considerarse como parte del mismo carácter, a menos que el carácter combinado resulte escesivamente ancho (según especifican los parámetros Anchura máxima de los caracteres y/o Relación de aspecto mínima de los caracteres).
Define el número mínimo de los píxeles de primer plano (es decir, texto) (0 - 1000; preajuste = 15) que un fragmento debe tener para considerar su posible inclusión en un carácter. Un fragmento de carácter es un objeto binario grande ("blob") en la imagen binarizada.
Define el número mínimo de los píxeles de primer plano (es decir, texto) (0 - 5000; preajuste = 30) que un carácter debe tener para que sea comunicado.
Define el modo utilizado para normalizar la imagen: Ninguno, Global, Local o Local avanzado (preajuste).
- Ninguno: No se ejecutará ninguna normalización.
- Global: Se ejecuta una normalización global utilizando la información de toda la región, no las variaciones locales.
- Local: Se ejecuta una normalización local, utilizando información sobre cada rectángulo de carácter local contenido en la región, para normalizar la imagen.
- Local avanzada: Se ejecuta una normalización local, utilizando información sobre cada rectángulo de carácter local contenido en la región, para normalizar la imagen, incluyendo ajustes no solo para el fondo, sino también el contraste del primer plano.
Define si se deben eliminar o no de una imagen normalizada todos los elementos que no tengan la misma anchura de trazo que el resto de la imagen (por defecto, este ajuste está activado). Este ajuste resulta útil, por ejemplo, cuando los caracteres parecen estar interconectados por rayas finas de ruido. Sin embargo, con este ajuste también se pueden borrar caracteres reales indebidamente si las anchuras de trazos son irregulares.
Define si la función ignorará completamente los fragmentos que toquen cualquier borde de la región (por defecto, esta opción está desactivada). Ignorar esos fragmentos puede ser útil para objetos no textuales, como bordes de etiquetas, que puedan encontrarse dentro de la región.
Define un modificador de porcentaje (0 - 100; preajuste = 50) en el rango utilizado para calcular en la imagen normalizada el umbral de binarización que binariza la imagen entre el primer plano y el fondo.
Define el contraste mínimo [en niveles de escala de grises de la imagen normalizada (0 - 255; preajuste = 30)] que un fragmento debe tener con respecto al umbral de binarización para que se considere su posible inclusión en un carácter.
Define la distancia, en píxeles (0 - 1000, preajuste = 0), que un fragmento puede desplazarse de la "línea principal" que atraviesa horizontalmente el texto.
Define el modo de análisis de caracteres a ejecutar para determinar la segmentación óptima de caracteres: Mínimo o Estándar (preajuste).
- Mínimo: Ejecuta una segmentación simple, de acuerdo con los parámetros de Segmentación.
- Estándar: Ejecuta un análisis de la línea en su conjunto, incluyendo el espaciado entre caracteres, para determinar la segmentación óptima.
Define el paso mínimo, en píxeles (0 - 1000; preajuste = 0), que puede haber entre dos caracteres, calculado a partir del parámetro Espaciado de caracteres. Si el paso entre dos fragmentos es menor, éstos deben considerarse como parte del mismo carácter, a menos que el carácter combinado resulte escesivamente ancho (según especifican los parámetros Anchura máxima de los caracteres y/o Relación de aspecto mínima de los caracteres). Por "paso entre caracteres" se entiende la distancia entre puntos (aproximadamente) correspondientes de caracteres adyacentes, no como la distancia entre el final de un carácter y el comienzo del siguiente (denominada espaciado entre caracteres).
Define cómo se medirá el paso entre caracteres: Automático (preajuste) , izquierda a izquierda, centro a centro o derecha a derecha.
- Si el parámetro Modo de análisis de segmentación se ajusta a Mínimo, este parámetro se desactivará.
- Los términos "izquierda" y "derecha" se refieren al eje de coordenadas definido por la región, es decir, "derecha" equivale a la dirección X positiva.
- Automático: Especifica que se está utilizando una métrica desconocida. El paso entre caracteres adecuado puede ser cualquiera de las otras posiciones de paso. De lo contrario, no habrá una posición de paso constante (como puede ser el caso de una fuente proporcional).
- Izquierda a izquierda: Especifica que el paso entre caracteres se mide como la distancia desde el lado izquierdo del rectángulo de un carácter hasta el lado izquierdo del rectángulo del carácter adyacente.
- Centro a centro: Especifica que el paso entre caracteres se mide como la distancia desde el centro del rectángulo de un carácter hasta el centro del rectángulo del carácter adyacente.
- Derecha a derecha: Especifica que el paso entre caracteres se mide como la distancia desde el lado derecho del rectángulo de un carácter hasta el lado derecho del rectángulo del carácter adyacente.
Define la métrica utilizada para definir el espaciado entre caracteres. Automático (preajuste), Fijo, Proporcional o Variable.
- Automático: Especifica que el tipo de paso es desconocido, pero se espera que sea fijo o proporcional, no variable.
- Fijo: Especifica que el paso es fijo, lo que significa que el paso entre cualquier par de caracteres es constante. Es decir, que es independiente de la anchura de los rectángulos de caracteres. El paso se mide con respecto al parámetro Posición del paso entre caracteres.
-
Proporcional: Especifica que el paso es proporcional, es decir, que el paso entre cualquier par de caracteres depende de esos caracteres en particular.
Note:- Aunque ninguna medición del paso entre caracteres es constante a lo largo de una cadena, generalmente la separación entre caracteres, que es la distancia desde la parte derecha del rectángulo de un carácter hasta el lado izquierdo del rectángulo del carácter adyacente, es más o menos constante.
- Los términos "izquierda" y "derecha" se refieren al eje de coordenadas definido por la región, es decir, "derecha" equivale a la dirección X positiva.
- Variable: Especifica que ninguna métrica de distancia entre caracteres es constante a lo largo de una cadena, es decir, que la ubicación de caracteres es errática y que el paso entre caracteres no es fijo ni proporcional.
Define si la herramienta ejecutará una validación de caracteres adicional durante la clasificación (por defecto, este parámetro está desactivado). Si se desactiva, la herramienta ejecutará una validación de caracteres adicional durante la clasificación, reduciendo las probabilidades de errores de lectura (es decir, las falsas aceptaciones de caracteres).
Define el tipo de imagen de salida que debería mostrarse: Imagen de entrada (preajuste), Imagen normalizada o Imagen binarizada.
- Imagen de entrada: Se mostrará la imagen de entrada activa.
- Imagen normalizada: Se mostrará la versión normalizada de la imagen.
- Imagen binarizada: Se mostrará la versión binarizada de la imagen.