Herramienta de identificación Leer texto (OCRMax) - ficha Campos
La ficha Campos permite crear y editar gráficamente los parámetros Cadena del campo y Definiciones de campos de la herramienta de identificación Leer texto (OCRMax). Los valores resultantes se insertan en la herramienta como cadenas literales.
La detección de campos permite verificar y corregir cadenas, devolviendo el conjunto de cadenas con las mejores coincidencias. La detección de campos tiene dos usos principales:
- Verificación de los resultados del reconocimiento óptico de caracteres (OCR), consistente en determinar si la cadena devuelta es correcta o no se ajusta a los parámetros Cadena del campo y Definiciones de campos.
- Corrección de los resultados del OCR, consistente en determinar si la cadena devuelta no se encuentra en la lista de resultados aceptables para intentar encontrar una cadena aceptable para el campo que esté más próximo a la cadena devuelta.
Un uso típico de la detección de campos es cuando la cadena contiene caracteres de prefijo y/o de sufijo. En este caso, la detección de campos permite ignorar esos caracteres de prefijo/sufijo. En este caso, Cadena del campo y Definiciones de campos determinan el desplazamiento de la posición de la cadena dentro de la región.
Especifica el número de caracteres contenidos en la cadena de caracteres. La Cadena de campo puede contener cualquier carácter alfanumérico detectado en el cuadro de diálogo de introducción de texto, es decir, (A - Z), (a - z), (0 - 9), guiones (-), puntos (.) y espacios ( ).
Cada carácter de Cadena del campo corresponde a una posición en el campo indexado entre 0 y 31. Cadena del campo debe contener al menos tantas posiciones como caracteres necesita la cadena para que su lectura sea aprobada (es decir, si hay 10 caracteres pero Cadena del campo solo especifica 9 caracteres, se devolverán los 9 que mejor coincidan. Sin embargo, si hay 8 caracteres y Cadena del campo define 9 caracteres, la función devolverá un n.º de error "#ERR"). De forma predeterminada, cada posición de la Cadena del campo se representa con un carácter de asterisco (*), llamado "comodín" alfanumérico. Esto significa que cualquier carácter es válido en cualquier posición de la cadena.
Sin embargo, cualquier posición de la Cadena del campo se puede limitar a un subconjunto de caracteres. Esto aumenta el rendimiento y la fiabilidad generales, ya que durante las lecturas no se considerarán los caracteres que no puedan aparecer en una posición determinada.
La entradas predefinidas de Cadena del campo son:
|
Cadena del campo Entrada |
Descripción | Caracteres válidos |
| * | Comodín | Cualquier carácter entrenado en la fuente. |
| N | Numérico | 0123456789 |
| A | Alfabético en mayúscula | ABCDEFGHIJKLMNOPQRSTUVWXYZ |
| a | Alfabético en minúscula | abcdefghijklmnopqrstuvwxyz |
| H | Hexadecimal, alfabético en mayúscula y numérico | 0123456789ABCDEF |
| h | Hexadecimal, alfabético en minúscula y numérico | 0123456789abcdef |
| O | Octal | 01234567 |
- Para restringir una posición de una Cadena del campo a un único carácter, introduzca éste. El carácter debe haber sido entrenado en la fuente y no puede ser una de las entradas predefinidas de Cadena del campo indicadas anteriormente, salvo que se haya reasignado mediante el parámetro Definiciones de campos.
- Para leer una cadena que contiene un espacio, incluya el espacio en Cadena del campo. ReadText no leerá un espacio si en esa posición la correspondiente entrada Cadena del campo es un asterisco (*).
Ejemplo 1 de cadena de un campo
Si Cadena del campo es **********AN, cualquier carácter de la fuente será válido en las primeras 10 posiciones de Cadena del campo. Sin embargo, en la 11ª posición solo se considerarán caracteres alfabéticos en mayúsculas durante la lectura. En la 12ª posición solo se considerarán caracteres numéricos.
Ejemplo 2 de cadena de un campo
La fuente solo contiene los caracteres numéricos 0-9 y /. Si Cadena del campo es NN/NN/NN, solo se considerarán caracteres numéricos en las posiciones primera y segunda, cuarta y quinta, séptima y octava. La barra inclinada (/) solo se considerará en las posiciones tercera y sexta.
Sin embargo, si Cadena del campo es NN/NN/AA, la lectura devolvería un número de error, ya que la fuente no contiene caracteres alfabéticos.
Define si en cada posición de carácter deben limitarse los resultados para que solo figuren los caracteres especificados por la detección de campos del carácter. Si se activa esta opción, todos los demás caracteres de la fuente se ignorarán, independientemente de su puntuación de clasificación.
Opcionalmente, los ajustes Definiciones de campos permiten crear entradas definidas por el usuario para la Cadena del campo. Si se incluyen en Cadena del campo, estas entradas restringen la lista de caracteres válidos en las posiciones en las que se insertan. Existen varias definiciones de campos predefinidas, y se puede añadir otras definidas por el usuario. Las definiciones predefinidas se muestran en texto gris y no se pueden borrar ni editar, solo activar o desactivar. Las definiciones definidas por el usuario se muestran en texto negro y se pueden añadir, borrar o editar. Para añadir una definición de campo, presione el botón Añadir nuevo, y luego asigne un icono y una definición al carácter.
Los caracteres mostrados en la entrada Definiciones de campos deben estar contenidos en la fuente. Por ejemplo: #=123 es válida si 1, 2 y 3 están incluidas en la fuente entrenada por el usuario. Sin embargo, #=123 sería inválida si 1, 2 y 3 no están incluidos en la fuente.
Ejemplo 1 de definiciones de campos
Si el valor de Definiciones de campos es #=123;$=3456;%=789, y Cadena del campo es #$%*******, los únicos caracteres que serán válidos en la primera posición serán 1, 2 o 3. Los únicos caracteres válidos en la segunda posición serán 3, 4, 5 o 6. En la tercera posición, solo 7, 8 y 9 serán válidos. En las posiciones cuarta a décima se admite cualquier carácter de la fuente.
Ejemplo 2 de definiciones de campos
Si el valor de Definiciones de campos es #=123;$=3456;%=789, A=A y Cadena del campo es #$%******A, los únicos caracteres que serán válidos en la primera posición serán 1, 2 o 3. Los únicos caracteres válidos en la segunda posición serán 3, 4, 5 o 6. En la tercera posición, solo 7, 8 y 9 serán válidos. En las posiciones cuarta a novena se admite cualquier carácter de la fuente. En la décima posición solo se admitirá el carácter A, ya que Definición del campo A=A reasigna la entrada Cadena del campo predefinida.