Identifizierungswerkzeug "Text lesen (OCRMax)" – Registerkarte "Segmentierung"
Auf der Registerkarte Segmentierung werden die Einstellungen zur Zeichensegmentierung im Bereich angepasst und geändert. Mit den Standardwerten und -einstellungen kann Text meist gelesen werden. Bei schwierigeren Fällen ist jedoch u. U. eine Anpassung einiger Parameterwerte erforderlich. In solchen Fällen kann das Problem üblicherweise behandelt werden, indem eine Mindestzeichenbreite, eine Höchstbreite und/oder eine Mindestneigung (d. h. der Abstand von Zeichen zu Zeichen, z. B. von der linken Kante eines Zeichens bis zur linken Kante des darauffolgenden Zeichens) festgelegt werden. Für schwierige Fälle und zur schnelleren Erstellung der Zeichensatzdatenbank öffnen Sie mit der Schaltfläche Auto-Tune das Dialogfeld "Auto-Tune", um mit dem Werkzeug automatisch die optimalen Segmentierungseinstellungen zu berechnen.
- Enthalten Bilder Hintergründe mit starken Strukturen oder so viel Rauschen, dass die Zeichen mit dem Hintergrund verschwimmen, ist die Segmentierung der Bilder schwierig.
- Der Bereich sollte nur die zu lesenden Zeichen enthalten, keine stark ausgeprägten, nicht dazugehörigen Merkmale wie etwa andere Zeichen oder Etikettkanten.
- Berühren sich zwei Zeichen, ist höchstwahrscheinlich eine Anpassung von Parametern erforderlich. Berühren sich Zeichen mit fester Breite, kann das Problem durch das Festlegen der Zeichenbreite behoben werden. Berührungen zwischen Zeichen proportionaler Schriftarten sind jedoch problematisch, da einige Fälle von der Funktion korrekt verarbeitet werden können, andere jedoch nicht.
- In Fällen mit kurzen Textzeilen (z. B. höchstens drei Zeichen) oder verhältnismäßig kurzen Zeilen mit viel Zeilenflattern sollte der erwartete Winkelbereich festgelegt werden, damit der Unsicherheitsfaktor bei der Bestimmung der Ausrichtung einer kurzen Textzeile von der Funktion kompensiert werden kann.
- Alle Zeichen in einer Zeichenzeile müssen dieselbe Ausrichtung und Neigung haben.
- Für eindeutig getrennten Punktmatrixdruck (z. B. Punkte berühren sich nicht) ist u. U. das Anpassen von Parametern wie Zeichenfragment Mindestgröße erforderlich, damit die Zeichen ordnungsgemäß segmentiert werden können.
- Die Zeichenstrichbreite muss mindestens zwei Pixel betragen.
- Die Mindestzeichengröße für große Zeichen (normalerweise alphanumerisch) beträgt 8 x 8 Pixel. Die Mindestzeichengröße für kleine Zeichen (wie z. B. Punkte) beträgt 2 x 2 Pixel.
Öffnet das Dialogfeld "Auto-Tune", das in Verbindung mit dem Identifizierungswerkzeug "Text lesen (OCRMax)" verwendet wird, um mittels Auto-Tune-Datensätzen zum Erstellen eines Auto-Tune-Modells die Segmentierungsparameter des Werkzeugs zu konfigurieren und eine Zeichensatzdatenbank zu trainieren. Ein Auto-Tune-Datensatz umfasst ein Bild, die Trainingszeichenfolge und die vom Benutzer bestätigte Position der Zeichen im Bild. Das Auto-Tune-Modell besteht aus mindestens einem Auto-Tune-Datensatz und den Einstellungen, die alle Bilder in den Auto-Tune-Datensätzen am besten segmentieren.
- Cognex empfiehlt bei Verwendung des Dialogfelds "Auto-Tune", dass die Segmentierung auf einem In-Sight-Emulator und nicht auf einem In-Sight-Vision-System erfolgt. Der Auto-Tune-Algorithmus des Werkzeugs "Text lesen (OCRMax)" erfordert eine hohe Computerleistung, weshalb die Performance auf dem Emulator im Vergleich zu einem Vision-System besser sein wird.
- Beim Trainieren einer Zeichensatzdatenbank und Verwenden des Dialogfelds "Auto-Tune" zum Segmentieren der Zeichen empfiehlt Cognex, den Vorgang mit Bildern zu beginnen, die am besten darstellen, wie die Zeichen aussehen sollten. Verwenden Sie also die besten Bilder zuerst. Auf diese Weise wird mit dem Auto-Tune-Algorithmus des Werkzeugs "Text lesen (OCRMax)" eine bessere Optimierung erzielt.
Gibt die Polarität der Zeichen im Eingabebild an: Schwarz auf Weiß, Weiß auf Schwarz oder Automatisch (Standard).
- Schwarz auf Weiß: Die Polarität des Texts ist schwarzer Text auf weißem Hintergrund.
- Weiß auf Schwarz: Die Polarität des Texts ist weißer Text auf schwarzem Hintergrund.
- Automatisch: Das Werkzeug erkennt die Polarität von Text und Hintergrund automatisch.
Gibt an, welche Variationen der Zeichenbreite im Zeichensatz zu erwarten sind: Automatisch (Standard), Fest oder Variabel.
- Automatisch: Die Zeichenbreite ist nicht bekannt; die Breite des Zeichensatzes ist entweder fest oder proportional.
- Fest: Alle Zeichenrechtecke im Zeichensatz haben dieselbe Breite.
- Variabel: Die Zeichen im Zeichensatz haben u. U. Zeichenrechtecke mit unterschiedlicher Breite.
Gibt die Mindestbreite eines Zeichenrechtecks in Pixeln (1 bis 1000; Standard = 3) an, die für das Erkennen eines Zeichens erforderlich ist.
Gibt die Mindesthöhe eines Zeichenrechtecks in Pixeln (1 bis 1000; Standard = 3) an, die für das Erkennen eines Zeichens erforderlich ist.
Gibt an, ob das Werkzeug die maximal zulässige Breite eines Zeichenrechtecks berücksichtigt (der Parameter ist standardmäßig deaktiviert).
Gibt die maximale Breite eines Zeichenrechtecks in Pixeln (1 bis 5000; Standard = 100) an, die für das Erkennen eines Zeichens eingehalten werden muss.
Gibt an, ob das Werkzeug die maximal zulässige Höhe eines Zeichenrechtecks berücksichtigt (der Parameter ist standardmäßig deaktiviert).
Gibt die maximale Höhe eines Zeichenrechtecks in Pixeln (1 bis 5000; Standard = 100) an, die für das Erkennen eines Zeichens eingehalten werden muss.
Gibt an, ob die Funktion das zulässige Mindestseitenverhältnis eines Zeichens berücksichtigt, wenn das Seitenverhältnis als die Höhe der gesamten Zeichenzeile geteilt durch die Breite des Zeichenrechtecks definiert ist (dieser Parameter ist standardmäßig aktiviert).
Gibt das zulässige Mindestseitenverhältnis (0 bis 500; Standard = 80) eines Zeichens an.
Gibt den Winkelsuchbereich in Grad an (0 bis 45; Standard = 0).
Gibt den Krümmungssuchbereich in Grad an (0 bis 45; Standard = 0).
Gibt an, ob auf dem Bild grafische Diagnosedaten angezeigt werden. Falls aktiviert, werden um beibehaltene Zeichen (grün), abgelehnte Zeichen (rot), beibehaltene Fragmente (zyan), abgelehnte Fragmente (gelb), die Hauptlinie des Texts (blau) und die erweiterte Hauptlinie des Texts (magenta) Bereiche gezeichnet.