Identifizierungswerkzeug "Text lesen (OCRMax)" – Registerkarte "Training"
Die Registerkarte Training dient zum Trainieren, Anzeigen, Umbenennen und Entfernen von Zeichen. Die Registerkarte ist in zwei Gruppen unterteilt: "Training", wo die Parameter für das Trainieren von Zeichen definiert sind, und "Zeichen", wo die trainierten Zeichensätze verwaltet werden.
- Auf der Registerkarte Training kann der Bereich angepasst werden, und die Segmentierungsgrafiken (Zeichenrechtecke) werden beim Ändern des Bereichs aktualisiert.
- Mehrbytezeichennamen (z. B. Kanji) werden nicht unterstützt. Mehrbytezeichen können eingelernt werden, dem Zeichen muss jedoch ein Einzelbytename gegeben werden.
- Trainingszeichenfolge: Gibt die zu trainierende Textzeichenfolge an. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss der Anzahl der segmentierten Zeichen entsprechen. Maximal 50 Zeichen können trainiert werden.
- Alle trainieren: Legt fest, dass alle Zeichen im Bereich eingelernt werden. Die zu trainierenden Zeichen werden in das Texteingabefeld Trainingszeichenfolge eingegeben, anschließend wird die Schaltfläche Alle trainieren gedrückt. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss der Anzahl der segmentierten Zeichen entsprechen.
- Neu trainieren: Legt fest, dass nur neue Zeichen im Bereich eingelernt werden. Die zu trainierenden Zeichen werden in das Texteingabefeld Trainingszeichenfolge eingegeben, anschließend wird die Schaltfläche Trainieren gedrückt. Die Anzahl der Zeichen im Texteingabefeld Trainingszeichenfolge muss der Anzahl der segmentierten Zeichen entsprechen.
- Auswahl trainieren: Legt fest, dass nur bestimmte Zeichen im Bereich eingelernt werden. Ist diese Option aktiviert, wird das Texteingabefeld Trainingszeichenfolge deaktiviert, und mit der Schaltfläche Auswahl trainieren wird das Dialogfeld Dem Zeichensatz die ausgewählten Zeichen hinzufügen aufgerufen. Dieses Dialogfeld enthält eine vollständige Abbildung des Bereichs, und unter jedem segmentierten Zeichen eine Bezeichnung und Texteingabefelder. Die Bezeichnung ist das derzeit dem Zeichen zugewiesene Symbol (unbekannte oder nicht eingelernte Zeichen werden mit einem Fragezeichen "?" gekennzeichnet). Unter der Bezeichnung befindet sich ein Texteingabefeld. Geben Sie in das Texteingabefeld eine Bezeichnung für jedes segmentierte Zeichen ein. Sollen Zeichen nicht neu trainiert werden, lassen Sie das Texteingabefeld leer. Klicken Sie auf die Schaltfläche Trainieren, um das Dialogfeld zu schließen.
Nach dem Einlernen ist jedes trainierte Zeichen in der Struktur sichtbar, in der dem Zeichen ein Ordner und eine Bezeichnung zugewiesen wird. Gegebenenfalls werden die Zeichen auch gruppiert (wenn die Bezeichnungen mehrerer Zeichen übereinstimmen).
- Wählen Sie den Zeichensatz-Stammordner, um im rechten Bereich alle Zeichen im Zeichensatz anzuzeigen. Die Zeichen werden als Symbole über einer Bezeichnung angezeigt.
- Wählen Sie einen Zeichenordner, um im rechten Bereich alle eingelernten Instanzen dieses Zeichens anzuzeigen. Die Zeichen werden als Symbole über einer Bezeichnung angezeigt.
-
Wählen Sie eine eingelernte Instanz eines Zeichens, um das Zeichen auf den rechten Bereich angepasst anzuzeigen.
Hinweis: Geben Sie mehrere Einlerninstanzen der Zeichen an, die während der Laufzeit gelesen werden sollen, damit die Funktion ähnliche Zeichentypen besser unterscheiden kann. Das Trainieren mehrerer Instanzen desselben Zeichens birgt jedoch Vor- und Nachteile. Der Vorteil des Einlernens mehrerer Instanzen ist die zu erwartende bessere Klassifizierungsleistung, vor allem beim Lesen von Text, der leicht falsch klassifiziert werden kann (z. B. 8 und B). Das Einlernen mehrerer Instanzen hat folgende Nachteile: eine verringerte Ausführungszeit der Funktion; u. U. eine Verringerung der Vertrauensergebnisse, da mehrere Einlerninstanzen nicht nur die höchste Güte, sondern auch die zweithöchste Güte verbessern; u. U. das Einlernen ungültiger Zeichen.
- Importieren: Öffnet das Dialogfeld "Öffnen", mit dem ein als OCRMax-Datendatei (*.ocm) gespeicherter Zeichensatz importiert werden kann.
- Exportieren: Öffnet das Dialogfeld "Speichern unter", mit dem ein Zeichensatz als OCRMax-Datendatei (*.ocm) gespeichert werden kann.
-
Umbenennen: Wählen Sie ein umzubenennendes Element, und klicken Sie anschließend auf diese Schaltfläche. Jedes Element in der Struktur oder im Listenbereich rechts kann umbenannt werden.
Hinweis: Durch das Umbenennen einer Gruppe von Zeichen wird allen Zeichen in der Gruppe eine neue Bezeichnung zugewiesen. Durch das Umbenennen eines einzelnen Zeichens wird diesem einzelnen, ausgewählten Zeichen eine neue Bezeichnung zugewiesen. Außerdem wird das Zeichen in der Struktur in eine neue oder andere Gruppe verschoben.
-
Löschen: Wählen Sie im Zeichensatz ein zu entfernendes Element, und klicken Sie anschließend auf diese Schaltfläche. Jedes Element in der Struktur oder im Listenbereich rechts kann umbenannt werden.
Hinweis: Das Löschen des Zeichensatzordners entfernt den Zeichensatz. Alle Zeichen werden gelöscht. Das Löschen einer Zeichengruppe entfernt alle Zeichen, deren Bezeichnung mit der Bezeichnung der gelöschten Gruppe übereinstimmt.