Identifizierungswerkzeug "Text lesen (OCRMax)" – Registerkarte "Erweitert"
Legt fest, wie das Tool beim Abbilden von Zeichen während der Segmentierung Zeichenfragmente verbindet: Überlappung erforderlich (Standard), Mindestzwischenraum zwischen Zeichen festlegen oder Mindestzwischenraum zwischen Zeichen/Maximalzwischenraum in Zeichen festlegen.
- Überlappung erforderlich: Zeichenfragmente müssen eine horizontale Überlappung von mindestens einem Pixel aufweisen, um zusammengeführt zu werden.
- Mindestzwischenraum zwischen Zeichen festlegen: Zeichenfragmente mit horizontalem Abstand können zur Abbildung von Zeichen zusammengeführt werden, wenn es sich um zwei Fragmente handelt, deren Abstand geringer ist, als im Parameter "Mindestzwischenraum zwischen Zeichen" festgelegt.
- Mindestzwischenraum zwischen Zeichen/Maximalzwischenraum in Zeichen festlegen: Zeichenfragmente mit horizontalem Abstand können zur Abbildung von Zeichen zusammengeführt werden, wenn es sich um zwei Fragmente handelt, deren Zusammenführung auf den Parameterwerten Mindestzwischenraum zwischen Zeichen und Maximalzwischenraum in Zeichen basiert.
Gibt den Mindestbruchteil (0 bis 100; Standard = 0) an, den zwei Zeichenfragmente in Richtung x überlappen müssen, um als Teil desselben Zeichens zu gelten.
Gibt auch bei beschädigten Zeichen die maximale Zwischenraumgröße, die in einem einzelnen Zeichen auftreten kann, in Pixeln an (0 bis 1000; Standard = 5).
Gibt die Mindestgröße des Zwischenraums zwischen zwei Zeichen in Pixeln an (0 bis 1000; Standard = 0). Der Zwischenraum wird von der rechten Kante des Rechtecks eines Zeichens bis zur linken Kante des Rechtecks des nächsten Zeichens gemessen. Unterschreitet der Abstand zwischen zwei Fragmenten diesen Wert, wird angenommen, dass es sich um Teile desselben Zeichens handelt, es sei denn das verbundene Zeichen ist zu breit (wie in den Parametern Maximale Zeichenbreite und/oder Mindestseitenverhältnis des Zeichens festgelegt).
Gibt die Mindestanzahl der Vordergrundpixel (d. h. Textpixel) an, (0 bis 1000, Standard = 15), die ein Fragment aufweisen muss, um als zu einem Zeichen gehörig zu gelten. Ein Zeichenfragment ist ein Blob im binarisierten Bild.
Gibt die Mindestanzahl der Vordergrundpixel (d. h. Textpixel) an, (0 bis 5000, Standard = 30), die ein Zeichen aufweisen muss, um gemeldet zu werden.
Gibt den Modus zum Normalisieren des Bildes an: Keine, Global, Lokal oder Lokal erweitert (Standard).
- Keine: Keine Normalisierung wird ausgeführt.
- Global: Eine globale Normalisierung wird ausgeführt. Dabei werden Informationen im ganzen Bereich und keine lokalen Abweichungen verwendet.
- Lokal: Eine lokale Normalisierung wird ausgeführt. Dabei werden zur Normalisierung des Bilds Informationen zu jedem lokalen Zeichenrechteck im Bereich verwendet.
- Lokal erweitert: Eine lokale Normalisierung wird ausgeführt. Dabei werden zur Normalisierung des Bilds Informationen zu jedem lokalen Zeichenrechteck im Bereich verwendet, einschließlich Anpassungen nicht nur für den Hintergrund, sondern auch für den Vordergrundkontrast.
Gibt an, ob aus einem normalisierten Bild alles entfernt wird, was nicht die gleiche Strichbreite wie der Rest des Bildes hat (diese Einstellung ist standardmäßig aktiviert). Diese Einstellung ist z. B. hilfreich, wenn Zeichen durch dünne Rauschlinien miteinander verbunden zu sein scheinen. Bei Verwendung dieser Einstellung werden jedoch u. U. auch echte Zeichen entfernt, deren Strichbreiten inkonsistent sind.
Legt fest, ob die Funktion Fragmente, die einen Rand des Bereichs berühren, vollständig ignoriert (diese Option ist standardmäßig deaktiviert). Das Ignorieren solcher Fragmente ist hilfreich, wenn der Bereich Nicht-Text-Merkmale wie etwa Etikettkanten einschließt.
Gibt einen Prozentmodifizierer (0 bis 100; Standard = 50) im Bereich an, der zum Berechnen des Binarisierungsgrenzwerts im normalisierten Bild verwendet wird, bei dem das Bild zwischen Vordergrund und Hintergrund binarisiert wird.
Gibt den Mindestkontrastwert an [in Graustufenwerten vom normalisierten Bild (0 bis 255; Standard = 30)], den ein Fragment relativ zum Binarisierungsgrenzwert haben muss, um als zu einem Zeichen gehörig zu gelten.
Gibt den Abstand in Pixeln an (0 bis 1000; Standard = 0), den ein Fragment zur "Hauptlinie" haben kann, die horizontal durch den Text verläuft.
Gibt den Typ des auszuführenden Zeichenananalysemodus an, um die optimale Zeichensegmentierung zu bestimmen: Minimal oder Standard (Standard).
- Minimal: Führt eine einfache Segmentierung entsprechend den Segmentierungsparametern durch.
- Standard: Führt eine Analyse der gesamten Zeile einschließlich des Zeichenabstands durch, um die optimale Segmentierung zu bestimmen.
Gibt die minimale Neigung zwischen zwei Zeichen in Pixeln (0 bis 1000) an, wenn die Neigung basierend auf dem Parameter Zeichenneigung – Position berechnet wird. Unterschreitet die Neigung zwischen zwei Fragmenten diesen Wert, wird angenommen, dass es sich um Teile desselben Zeichens handelt, es sei denn, das verbundene Zeichen ist zu breit (wie in den Parametern Maximale Zeichenbreite und/oder Mindestseitenverhältnis des Zeichens festgelegt). Die Neigung ist der Abstand zwischen (ungefähr) korrespondierenden oder benachbarten Zeichen und nicht der Abstand zwischen dem Ende eines Zeichens und dem Anfang des nächsten Zeichens (dieser Abstand wird als Zeichenzwischenraum bezeichnet).
Gibt an, wie die Neigung zwischen Zeichen gemessen wird: Automatisch (Standard), "Links zu links", "Mitte zu Mitte" oder "Rechts zu rechts".
- Ist der Parameter Segmentierungsanalysemodus auf Minimal gesetzt, wird dieser Parameter deaktiviert.
- Die Begriffe "links" und "rechts" gelten relativ zu der durch den Bereich definierten Koordinatenachse, d. h. "rechts" entspricht der positiven x-Richtung.
- Automatisch: Gibt an, dass eine unbekannte Metrik verwendet wird. Die richtige Neigung kann eine beliebige der anderen Neigungspositionen sein, oder es ist keine konstante Neigungsposition vorhanden (wie es bei der Neigung proportionaler Schriftarten der Fall sein kann).
- Links zu links: Legt die Neigung als den Abstand zwischen der linken Seite eines Zeichenrechtecks zur linken Seite des benachbarten Zeichenrechtecks fest.
- Mitte zu Mitte: Legt die Neigung als den Abstand zwischen der Mitte eines Zeichenrechtecks zur Mitte des benachbarten Zeichenrechtecks fest.
- Rechts zu rechts: Legt die Neigung als die Distanz von der rechten Seite eines Zeichenrechtecks bis zur rechten Seite des benachbarten Zeichenrechtecks fest.
Legt die Metrik fest, die zum Definieren des Zeichenabstands verwendet wird: Automatisch (Standard), Fest, Proportional oder Variabel.
- Automatisch: Gibt an, dass der Neigungstyp unbekannt ist, wahrscheinlich aber entweder fest oder proportional und nicht variabel ist.
- Fest: Gibt an, dass die Neigung fest ist, d. h., die Neigung zwischen allen Zeichenpaaren ist konstant, unabhängig von der Breite der Zeichenrechtecke oder der Zeichen. Die Neigung wird basierend auf dem Parameter Zeichenneigung – Position gemessen.
-
Proportional: Gibt an, dass die Neigung proportional ist, d. h., die Neigung zwischen einem Zeichenpaar hängt von den jeweiligen Zeichen ab.
Hinweis:- Die Neigungsmessungen in einer Zeichenfolge sind nicht konstant. Der Zeichenzwischenraum – der Abstand zwischen der rechten Seite eines Zeichenrechtecks und der linken Seite des benachbarten Zeichenrechtecks – ist jedoch annähernd konstant.
- Die Begriffe "links" und "rechts" gelten relativ zu der durch den Bereich definierten Koordinatenachse, d. h. "rechts" entspricht der positiven x-Richtung.
- Variabel: Gibt an, dass in einer Zeichenfolge keine Abstandsmetrik zwischen zwei Zeichen konstant ist. Die Zeichenplatzierung ist z. B. unregelmäßig, und die Neigung ist weder fest noch proportional.
Legt fest, ob das Werkzeug während der Klassifizierung eine zusätzliche Zeichenprüfung ausführt (standardmäßig ist dieser Parameter deaktiviert). Ist dieser Parameter deaktiviert, führt das Werkzeug während der Klassifizierung eine zusätzliche Zeichenprüfung aus, um die Wahrscheinlichkeit von Lesefehlern (d. h. das fälschliche Akzeptieren eines Zeichens) zu reduzieren.
Gibt den Typ des anzuzeigenden Ausgabebilds an: Eingabebild (Standard), Normalisiertes Bild oder Binarisiertes Bild.
- Eingabebild: Das aktive Eingabebild wird angezeigt.
- Normalisiertes Bild: Die normalisierte Version des Bilds wird angezeigt.
- Binarisiertes Bild: Die binarisierte Version des Bilds wird angezeigt.