Zeichensatz trainieren
Die Registerkarte Zeichensatz trainieren dient zum Trainieren, Anzeigen, Umbenennen und Entfernen von Zeichen. Die Registerkarte ist in zwei Gruppen geteilt: Zeichen, wo die trainierten Zeichensätze verwaltet werden können, und Training, wo die Parameter für das Training der Zeichen definiert werden können.
Hinweis:
- Die Steuerelemente auf dieser Registerkarte sind mit den Parametern Trainingsmodus, Trainingszeichenfolge und Zeichensatz trainieren auf der Registerkarte „Allgemein“ nicht verknüpft.
- Während Sie auf der Registerkarte Zeichensatz trainieren sind, kann der Inspektionsbereich eingestellt werden (die Schaltfläche „Grafik bearbeiten“ ist aktiviert) und die Segmentierungsgrafik (die Zeichenrechtecke) werden aktualisiert, wenn der ROI verändert wird.
- Mehrbyte-Zeichennamen (z. B. Kanji) werden nicht unterstützt. Mehrbytezeichen können trainiert werden, dem Zeichen muss jedoch ein Einzelbytename gegeben werden.
Steuerelemente im Feld „Zeichen“
Nach dem Trainieren ist jedes trainierte Zeichen in der Struktur sichtbar, in der dem Zeichen ein Ordner und eine Bezeichnung zugewiesen wird, und sie gegebenenfalls gruppiert werden (wenn die Bezeichnungen mehrerer Zeichen übereinstimmen).
- Wählen Sie den Zeichensatz-Stammordner, um im rechten Bereich alle Zeichen im Zeichensatz anzuzeigen. Die Zeichen werden als Symbole über einer Bezeichnung angezeigt.
- Wählen Sie einen Zeichenordner, um im rechten Bereich alle trainierten Instanzen dieses Zeichens anzeigen zu lassen. Die Zeichen werden als Symbole über einer Bezeichnung angezeigt.
- Wählen Sie eine trainierte Instanz eines Zeichens, um das Zeichen im rechten Bereich angepasst anzuzeigen.
Tipp: Stellen Sie der OCRMax-Funktion mehrere Trainingsinstanzen für jedes Zeichen bereit, die während der Laufzeit gelesen werden sollen, damit die Funktion ähnliche Zeichentypen besser unterscheiden kann. Das Trainieren mehrerer Instanzen desselben Zeichens birgt jedoch Vor- und Nachteile.
Der Vorteil des Trainings mehrerer Instanzen ist die zu erwartende bessere Klassifizierungsleistung, vor allem beim Lesen von Text, der leicht falsch klassifiziert werden kann (z. B. 8 und B). Der Nachteil des Trainings mehrerer Instanzen ist die verringerte Ausführungszeit der Funktion; u. U. eine Verringerung der Vertrauensergebnisse, da mehrere Trainingsinstanzen nicht nur die höchste Güte, sondern auch die zweithöchste Güte verbessern; u. U. werden ungültiger Zeichen trainiert.
Der Vorteil des Trainings mehrerer Instanzen ist die zu erwartende bessere Klassifizierungsleistung, vor allem beim Lesen von Text, der leicht falsch klassifiziert werden kann (z. B. 8 und B). Der Nachteil des Trainings mehrerer Instanzen ist die verringerte Ausführungszeit der Funktion; u. U. eine Verringerung der Vertrauensergebnisse, da mehrere Trainingsinstanzen nicht nur die höchste Güte, sondern auch die zweithöchste Güte verbessern; u. U. werden ungültiger Zeichen trainiert.
- Zeichensatz importieren: Öffnet das Dialogfeld „Öffnen“, mit dem ein als OCRMax-Zeichensatzdatei (*.ocm) gespeicherter Zeichensatz importiert werden kann.
- Zeichensatz exportieren: Öffnet das Dialogfeld „Speichern unter“, mit dem ein Zeichensatz als OCRMax-Zeichensatzdatei (*.ocm) gespeichert werden kann.
- Umbenennen: Wählen Sie ein umzubenennendes Element und klicken Sie anschließend auf diese Schaltfläche. Jedes Element in der Struktur oder im Listenbereich rechts kann umbenannt werden.
Hinweis: Durch das Umbenennen einer Gruppe von Zeichen wird allen Zeichen in der Gruppe eine neue Beschriftung zugewiesen. Durch das Umbenennen eines einzelnen Zeichens wird diesem einzelnen, ausgewählten Zeichen eine neue Bezeichnung zugewiesen. Außerdem wird das Zeichen in der Struktur in eine neue oder andere Gruppe verschoben.
- Löschen: Wählen Sie im Zeichensatz ein zu entfernendes Element und klicken Sie anschließend auf diese Schaltfläche. Jedes Element in der Struktur oder im Listenbereich auf der rechten Seite kann umbenannt werden.
Hinweis: Durch das Löschen des Zeichensatzordners wird der Zeichensatz entfernt. Alle Zeichen werden gelöscht. Das Löschen einer Zeichengruppe entfernt alle Zeichen, deren Bezeichnung mit der gelöschten Gruppe übereinstimmt.
Training – Feld
Zeichen müssen korrekt segmentiert sein, bevor sie trainiert werden können.
- Dem Zeichensatz alle Zeichen hinzufügen: Legt fest, dass alle Zeichen im ROI trainiert werden sollen. Die zu trainierenden Zeichen werde in das Texteingabefeld Trainingszeichenfolge eingegeben, bevor die Schaltfläche Trainieren gedrückt wird. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss mit der Anzahl der segmentierten Zeichen übereinstimmen.
- Dem Zeichensatz neue Zeichen hinzufügen: Legt fest, dass nur neue Zeichen im ROI trainiert werden sollen. Die zu trainierenden Zeichen werde in das Texteingabefeld Trainingszeichenfolge eingegeben, bevor die Schaltfläche Trainieren gedrückt wird. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss mit der Anzahl der segmentierten Zeichen übereinstimmen.
- Dem Zeichensatz einzelne Zeichen hinzufügen: Legt fest, dass bestimmte Zeichen im ROI trainiert werden sollen. Wenn diese Option ausgewählt wird, wird das Texteingabefeld Trainingszeichenfolge deaktiviert und über die Schaltfläche Trainieren öffnet sich das Dialogfeld Dem Zeichensatz die ausgewählten Zeichen hinzufügen. Dieses Dialogfeld enthält eine vollständige Abbildung des Inspektionsbereichs und unter jedem segmentierten Zeichen eine Bezeichnung und Texteingabefelder. Als Beschriftung wird das aktuell dem Zeichen zugewiesene Symbol verwendet (ein „?“ steht für ein unbekanntes oder nicht trainiertes Zeichen). Unter der Beschriftung befindet sich ein Texteingabefeld. Geben Sie in das Texteingabefeld eine Beschriftung für jedes segmentierte Zeichen ein. Sollen Zeichen nicht neu trainiert werden, lassen Sie das Texteingabefeld leer. Klicken Sie auf die Schaltfläche Trainieren, um das Dialogfeld zu schließen.
- Trainingszeichenfolge: Gibt die zu trainierende Textzeichenfolge an. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss mit der Anzahl der segmentierten Zeichen übereinstimmen.
- Schaltfläche „Trainieren“: Aktiviert das Training.