OCRMax
Die OCRMax-Funktion schreibt und/oder überprüft eine Textzeichenfolge innerhalb eines Inspektionsbereichs (ROI), nachdem die Funktion mit vom Benutzer definierten Zeichen trainiert wurde. OCRMax führt durch Segmentierung und Klassifizierung eine optische Zeichenerkennung (OCR) aus. Die Segmentierung wird zuerst durchgeführt. Unter Verwendung von Schwellenwerttechniken werden Teile des Bilds identifiziert, die anscheinend Textzeilen enthalten. Nach dem Segmentieren des Texts in Zeichen werden die Zeichen trainiert und als Zeichensatz-Datenbank gespeichert. Die Klassifizierung findet während der Laufzeit statt. Dabei wird der bei der Segmentierung gefundene Text „gelesen“. Die Bilder der segmentierten Zeichen werden dazu mit den trainierten Zeichen im Datensatz verglichen.
Während des Segmentierungsvorgangs bestimmt die OCRMax-Funktion die Position der Textzeile innerhalb des Inspektionsbereichs und rechnet den Winkel, die Neigung und die Polarität des Texts aus. Der Bereich wird dann normalisiert, um ungewolltes Rauschen zu entfernen, bevor der Bereich in Vorder- und Hintergrund-Pixel binarisiert wird. Am binarisierten Bild wird eine Blobanalyse ausgeführt, um Zeichenfragmente zu produzieren, wobei jedes Zeichenfragment ein einzelnes Blob darstellt. Zeichenfragmente werden dann gruppiert, um Zeichen zu bilden, die einem Zeichenbereich zugeordnet werden. Der Zeichenbereich ist ein enger, nicht editierbarer Begrenzungsrahmen, der alle Vordergrund-Pixel (z. B. Farbe) im Inspektionsbereich (ROI) einschließt.
Die Textzeile im Inspektionsbereich ist in Bilder mit einzelnen Zeichen unterteilt, und jedes Zeichen ist von einem nicht editierbaren Zeichenrechteck umschlossen. Der ROI definiert die ungefähre Position, den Winkel und die Neigung der Textzeile. Mithilfe der Parameter „Winkelbereich“ und „Neigungsbereich“ auf der Registerkarte „Segmentierung“ können Sie, falls erforderlich, Abweichungen kompensieren.
OCRMax – Eingaben
Das OCRMax-Eigenschaftsblatt bietet eine Reihe von Einstellungen für die Feinabstimmung der Ergebnisse der Funktion. Diese können über die Registerkarten des Eigenschaftsblatts aufgerufen werden: Allgemein, Segmentierung, Zeichensatz trainieren, Felderkennung, Ergebnisse und Diagnose.
Außerdem startet die Schaltfläche Auto-Tune auf dem OCRMax-Eigenschaftsblatt das Dialogfeld Dialogfeld „Auto-Tune“, mit dem die optimalen Parameter für die Segmentierung automatisch berechnet und eine Zeichensatzdatenbank trainiert werden kann. Wenn das Dialogfeld „Auto-Tune“ aktiv ist und ein oder mehrere Bilder geladen sind, wird jedes Bild untersucht, um zu überprüfen, dass die Zeichen korrekt segmentiert und klassifiziert werden. Wenn die Zeichen nicht korrekt segmentiert werden, berechnet der Auto-Tune-Algorithmus die optimalen Segmentierungsparameter für die Segmentierung des aktuellen Bilds, sowie die vorher trainierten Bilder. Das Trainieren weiterer Bilder macht den Auto-Tune-Algorithmus der OCRMax-Funktion zuverlässiger und genauer. Sobald zufriedenstellende Ergebnisse erzielt werden, wird das Dialogfeld „Auto-Tune“ geschlossen, es werden die neuen Segmentierungsparameter angewendet und die Zeichensatzdatenbank wird mit den neu trainierten Zeichen aktualisiert.
- Bilder benötigen nur einen Durchlauf, anstatt zwei (einmal zum Tuning der Segmentierungsparameter, und ein zweites Mal zum Trainieren).
- Die Lesegenauigkeit sollte besser sein, da die Zeichen automatisch mit den Segmentierungsparametern trainiert werden, die beim Tuningvorgang erhalten wurden.
OCRMax – Ausgaben
|
Rückgabewert |
Eine OCRMax-Datenstruktur mit der gelesenen Zeichenfolge oder #ERR, wenn mindestens ein Eingabeparameter ungültig ist. |
||||||||||||||||||||||||||||||
|
Ergebnisse |
Wenn OCRMax anfänglich in eine Zelle eingefügt wird, wird in der Tabelle automatisch eine Ergebnistabelle mit den folgenden OCRMax Vision Data Access functions erstellt.
|