Felderkennung
Die Registerkarte Felderkennung ermöglicht eine grafische Erstellung und Bearbeitung für die Parameter „Feldzeichenfolge“ und „Felddefinitionen“ der OCRMax-Funktion. Die Ergebniswerte werden als literale Zeichenfolgen in die Funktion eingefügt.
Die „Felderkennung“ bietet die Möglichkeit, Zeichenfolgen zu überprüfen und zu korrigieren, damit gültige Zeichenfolgen mit der größtmöglichen Übereinstimmung zurückgegeben werden. „Felderkennung“ hat zwei Hauptfunktionen:
- OCR-Ergebnisüberprüfung, bei der die zurückgegebene Zeichenfolge anhand der Parameter „Feldzeichenfolge“ und „Felddefinitionen“ als korrekt oder inkorrekt bewertet wird.
- Korrektur der OCR-Ergebnisse, wenn sich die zurückgegebene Zeichenfolge nicht in der Liste akzeptabler Ergebnisse befindet und versucht wird, eine akzeptable Zeichenfolge zu finden, die der zurückgegebenen Zeichenfolge am ähnlichsten ist.
Ein typischer Anwendungsfall für „Felderkennung“ liegt vor, wenn die Zeichenfolge Präfix- oder Suffixzeichen enthält und „Felderkennung“ verwendet wird, um diese Präfix-/Suffixzeichen zu ignorieren. In diesem Fall wird durch die Parameter „Feldzeichenfolge“ und „Felddefinitionen“ der Offset der Position der Zeichenfolge im Inspektionsbereich ermittelt.
Feldzeichenfolge
Gibt die im Zeichensatz enthaltene Anzahl von Zeichen an. Ein Eintrag für die Feldzeichenfolge kann ein beliebiges, im Dialogfeld zur Texteingabe gefundenes Zeichen sein, einschließlich (A bis Z), (a bis z), (0 bis 9), Bindestrichen (-), Punkten (.) und Leerzeichen ( ).
Jedes Zeichen im Feld Feldzeichenfolge entspricht einer indizierten Feldposition zwischen 0 und 31. Die Feldzeichenfolge muss mindestens die gleiche Anzahl von Positionen beinhalten, die der Anzahl der Zeichen in der Zeichenfolge entspricht, damit das Lesen erfolgreich verläuft. Wenn also 10 Zeichen vorhanden sind, die Feldzeichenfolge jedoch nur 9 Zeichen vorgibt, werden die 9 Zeichen mit der größten Übereinstimmung zurückgegeben. Falls jedoch 8 Zeichen vorhanden sind und die Feldzeichenfolge 9 vorgibt, gibt die Funktion #ERR aus. Standardmäßig wird jede Position in der Feldzeichenfolge als Sternchen (*) oder alphanumerischer Platzhalter dargestellt. Das bedeutet, dass jedes Zeichen an jeder Position der Zeichenfolge gültig ist.
In der Feldzeichenfolge können jedoch einzelne Positionen begrenzt werden, damit an dieser Position nur eine Teilmenge möglicher Zeichen berücksichtigt wird. Dadurch wird die Gesamtleistung und Zuverlässigkeit verbessert, da an einer Position nicht mögliche Zeichen bei einer Lesung nicht berücksichtigt werden.
Die vordefinierten Einträge für die Feldzeichenfolge lauten:
|
Feldzeichenfolge – Eintrag |
Beschreibung |
Gültige Zeichen |
|---|---|---|
|
* |
Platzhalter |
Beliebiges trainiertes Zeichen im Zeichensatz. |
|
N |
Ziffern |
0123456789 |
|
A |
Großbuchstaben |
ABCDEFGHIJKLMNOPQRSTUVWXYZ |
|
a |
Kleinbuchstaben |
abcdefghijklmnopqrstuvwxyz |
|
H |
Hexadezimalzeichen, Großbuchstaben und Ziffern |
0123456789ABCDEF |
|
h |
Hexadezimalzeichen, Kleinbuchstaben und Ziffern |
0123456789abcdef |
|
O |
Oktal |
01234567 |
Feldzeichenfolge – Beispiel 1
Lautet die Feldzeichenfolge **********AN, ist an den ersten 10 Zeichenfolgepositionen jedes Zeichen im Zeichensatz gültig. An der 11. Position werden jedoch beim Lesevorgang nur Großbuchstaben berücksichtigt. Und an der 12. Position werden nur numerische Zeichen berücksichtigt.
Zeichenbereich – Beispiel 2
Der Zeichensatz enthält nur die numerischen Zeichen 0 — 9 und /. Lautet die Feldzeichenfolge NN/NN/NN, werden an der ersten und zweiten, vierten und fünften sowie siebten und achten Position nur numerische Zeichen berücksichtigt. An der dritten und sechsten Position wird nur der Schrägstrich (/) berücksichtigt.
Lautet die Feldzeichenfolge jedoch NN/NN/AA, wird beim Lesevorgang eine Fehlermeldung ausgegeben, da der Zeichensatz keine Alphazeichen enthält.
Felddefinitionen
Die Einstellungen für die Felddefinitionen können optional auch dazu verwendet werden, benutzerdefinierte Einträge für die Feldzeichenfolge zu erstellen. Wenn diese Einträge in der Feldzeichenfolge enthalten sind, dann schränken sie die Liste mit gültigen Zeichen an den Positionen ein, an denen sie eingefügt werden. Mehrere vordefinierte Felddefinitionen stehen zur Verfügung, und es können auch benutzerdefinierte Felddefinitionen hinzugefügt werden. Die vordefinierten Definitionen werden als grauer Text angezeigt und können lediglich aktiviert oder deaktiviert, nicht aber entfernt oder bearbeitet werden. Benutzerdefinierte Definitionen werden als schwarzer Text angezeigt und können hinzugefügt, entfernt oder bearbeitet werden. Möchten Sie eine Felddefinition hinzufügen, klicken Sie auf die Schaltfläche Neue hinzufügen, und weisen Sie dem Zeichen ein Symbol und anschließend eine Definition zu.
- Die Anzahl der benutzerdefinierten Definitionen ist durch die Ausdruckslänge der OCRMax-Funktion beschränkt (249).
- Jede benutzerdefinierte Definition, die deaktiviert ist, wenn das Eigenschaftsblatt von OCRMax geschlossen wird, wird gelöscht und nicht mehr zur Verfügung stehen, wenn das Eigenschaftsblatt der Funktion erneut geöffnet wird.
- Wenn der Parameter „Felddefinitionen“ auf der Registerkarte „Allgemein“ als Zellreferenzen definiert wird, wird die Option Felddefinitionen auf der Registerkarte Felderkennung deaktiviert, und der aktuelle Wert der Zellreferenz wird angezeigt.
Zeichen für einen Felddefinitionen-Eintrag müssen im Zeichensatz enthalten sein. Zum Beispiel ist #=123 gültig, wenn 1, 2 und 3 im benutzerdefinierten, trainierten Zeichensatz enthalten sind. Wären 1, 2 und 3 jedoch nicht im Zeichensatz enthalten, wäre #=123 ungültig.
Felddefinitionen – Beispiel 1
Lautet der Wert von Felddefinitionen #=123;$=3456;%=789 und die Feldzeichenfolge #$%*******, sind an der ersten Position nur die Zeichen 1, 2 oder 3 gültig. An der zweiten Position sind nur die Zeichen 3, 4, 5 oder 6 gültig. An der dritten Position sind nur 7, 8 oder 9 gültig. An den Positionen vier bis zehn sind alle Zeichen im Zeichensatz gültig.
Felddefinitionen – Beispiel 2
Lautet der Wert von Felddefinitionen #=123;$=3456;%=789, A=A und die Feldzeichenfolge #$%******A, sind an der ersten Position nur die Zeichen 1, 2 oder 3 gültig. An der zweiten Position sind nur die Zeichen 3, 4, 5 oder 6 gültig. An der dritten Position sind nur 7, 8 oder 9 gültig. An den Positionen vier bis neun sind alle Zeichen im Zeichensatz gültig. An der zehnten Position wird nur das Zeichen A berücksichtigt, da die Felddefinition A=A den vordefinierten Eintrag für die Feldzeichenfolge erneut zuordnet.
Feldzeichenfolge-Parameter
- Nur Zeichen in der Feldzeichenfolge abgleichen: Bestimmt, ob die Funktion nur versucht, Zeichen mit Zeichen abzugleichen, die durch die Feldzeichenfolge indiziert sind.
- Zeichenfolgen in verschiedenen Längen: Gibt an, ob die definierte Feldzeichenfolge eine Teilzeichenfolge einer kompletten eingelesenen Zeichenfolge sein kann. Wird eine Teilzeichenfolge gefunden, wird die am ehesten übereinstimmende Teilzeichenfolge zurückgegeben.
- Mindestlänge: Wenn der Parameter Zeichenfolgen in verschiedenen Längen aktiviert ist, legt dieser Parameter die akzeptable Mindestzeichenfolgelänge (0 - 100; Standard = 1) fest.
- Maximale Länge: Wenn der Parameter Zeichenfolgen in verschiedenen Längen aktiviert ist, legt dieser Parameter die akzeptable Maximal-Zeichenfolgenlänge (0 - 100; Standard = 100) fest.
- Maximaler Startindex: Wenn der Parameter Zeichenfolgen in verschiedenen Längen aktiviert ist, legt dieser Parameter die zu berücksichtigenden Felderkennung-Untersequenzen fest, deren Startposition diesen Indexwert nicht überschreiten darf (0 – 100; Standard = 100).
- Minimaler Endindex: Wenn der Parameter Zeichenfolgen in verschiedenen Längen aktiviert ist, legt dieser Parameter die zu berücksichtigenden Felderkennung-Untersequenzen fest, deren Startposition diesen Indexwert nicht unterschreiten darf (0 – 100; Standard = 0).