Herramienta de identificación Leer texto (OCRMax) - ficha Entrenamiento
La ficha Entrenamiento permite entrenar, ver, cambiar el nombre y eliminar caracteres. La ficha está dividida en dos grupos: Entrenamiento, donde se definen los parámetros de entrenamiento de caracteres, y Caracteres, donde se administran las fuentes entrenadas.
- La ficha Entrenamiento permite ajustar la región y actualizar los gráficos de segmentación (rectángulos de caracteres) según se va modificando la región.
- No se admiten nombres de caracteres de alfabetos "multibyte" (por ejemplo, Kanji). Aunque se pueden entrenar caracteres multibyte, el nombre que se les asigne debe estar compuesto por caracteres de un solo byte.
- Cadena de entrenamiento: La cadena de texto a entrenar. El número de caracteres contenidos en el cuadro de texto Cadena de entrenamiento debe coincidir con el número de caracteres segmentados. Se puede entrenar un máximo de 50 caracteres.
- Entrenar todos: Indica que deben entrenarse todos los caracteres de la región. Los caracteres que se prevé entrenar se introducen en el cuadro de texto Cadena de entrenamiento antes de presionar el botón Entrenar todos. El número de caracteres contenidos en el cuadro de texto Cadena de entrenamiento debe coincidir con el número de caracteres segmentados.
- Entrenar nuevos: Indica que solo deben entrenarse los caracteres nuevos de la región. Los caracteres que se prevé entrenar se introducen en el cuadro de texto Cadena de entrenamiento antes de presionar el botón Entrenar. El número de caracteres contenidos en el cuadro de texto Cadena de entrenamiento debe coincidir con el número de caracteres segmentados.
- Entrenar seleccionados: Indica que deben entrenarse determinados caracteres de la región. Al activar esta opción se desactiva el cuadro de texto Cadena de entrenamiento y el botón Entrenar seleccionados abrirá el cuadro de diálogo Añadir los caracteres seleccionados a la fuente. Este cuadro de diálogo contiene una imagen "no envuelta" de la región, con una etiqueta y cuadros de introducción de texto bajo cada uno de los caracteres segmentados. La etiqueta es el símbolo actualmente asociado a ese carácter (un símbolo de interrogación "?" indica un carácter desconocido o no entrenado). Debajo de la etiqueta aparece un cuadro de texto. Introduzca una etiqueta por cada carácter segmentado en el cuadro de texto. Para no entrenar caracteres, deje el cuadro de texto vacío. Para cerrar el cuadro de diálogo, presione el botón Entrenar.
Después del entrenamiento, todos los caracteres entrenados se mostrarán en el árbol, donde se les asignará una carpeta y una etiqueta, y se agruparán (si los caracteres tienen etiquetas coincidentes).
- Para mostrar todos los caracteres del tipo de letra en el panel de la derecha, seleccione la carpeta raíz "Fuente". Los caracteres se mostrarán como iconos con una etiqueta debajo.
- Seleccione una carpeta de un carácter para mostrar todas las instancias entrenadas de ese carácter en el panel de la derecha. Los caracteres se mostrarán como iconos con una etiqueta debajo.
-
Para mostrar un carácter, seleccione una instancia entrenada del mismo, ampliada con zoom para rellenar el panel de la derecha.
Tip: Si se proporcionan a la herramienta múltiples instancias entrenadas de cada carácter a leer durante la ejecución, la función distinguirá mejor los tipos de caracteres similares. Sin embargo, entrenar varias instancias de un mismo carácter tiene ventajas y desventajas. La ventaja de entrenar múltiples instancias consiste en que cabe esperar un mejor rendimiento de clasificación, sobre todo al leer textos fácilmente confundibles (por ejemplo, 8 y B). Las desventajas de entrenar varias instancias son: aumento del tiempo de ejecución de la función, posible disminución de las puntuaciones de fiabilidad, ya que con múltiples instancias de entrenamiento no solo mejorará la puntuación más alta, sino también la segunda más alta, lo que podría entrenar caracteres incorrectos. - Importar: Abre el cuadro de diálogo Abrir, que permite importar una fuente guardada como archivo de datos OCRMax (*.ocm).
- Exportar: Abre el cuadro de diálogo Guardar como, que permite guardar un archivo de datos OCRMax (*.ocm).
- Cambiar nombre: Elija esta opción después de seleccionar un elemento para cambiar su nombre. Se puede cambiar el nombre de cualquier elemento contenido en el árbol o en el panel de lista del lado derecho.
-
Note: Si cambia el nombre de un grupo de caracteres, se asignará una nueva etiqueta a todos los caracteres del grupo. Si cambia el nombre de un solo carácter, se asignará una nueva etiqueta a dicho carácter único seleccionado; el carácter se transferirá a otro grupo del árbol, o a uno nuevo.
-
Eliminar: Elija esta opción después de seleccionar un elemento para quitarlo de la fuente. Se puede cambiar el nombre de cualquier elemento contenido en el árbol o en el panel de lista del lado derecho.
Note: Si elimina la carpeta Fuente, también se eliminará la fuente; todos los caracteres se eliminarán. Si se elimina un grupo de caracteres, también se eliminarán todos los caracteres cuya etiqueta coincida con la etiqueta del grupo eliminado.