Outil d'identification Lire le texte (OCRMax) - Onglet Apprentissage
L'onglet Apprentissage est utilisé pour apprendre, afficher, renommer et supprimer les caractères. Cet onglet est divisé en deux groupes : Apprentissage, dans lequel les paramètres d'apprentissage des caractères sont définis, et Caractères, dans lequel les polices apprises sont gérées.
Remarque :
- sous l'onglet Apprentissage, la région peut être ajustée et les graphiques de segmentation (rectangles de caractère) sont mis à jour lorsque la région est modifiée.
- Les noms de caractère à plusieurs octets (par exemple, Kanji) ne sont pas pris en charge. Les caractères à plusieurs octets peuvent être appris, mais le nom donné au caractère doit être à un octet.
Remarque : pour que les caractères puissent être appris, ils doivent être correctement segmentés.
- Chaîne d'apprentissage : spécifie la chaîne de texte à apprendre. Le nombre de caractères de la zone de texte Chaîne d'apprentissage doit correspondre au nombre de caractères segmentés. 50 caractères maximum peuvent être appris.
- Apprendre tous : spécifie que tous les caractères de la région seront appris. Les caractères à apprendre sont saisis dans la zone de texte Chaîne d'apprentissage, avant de cliquer sur le bouton Apprendre tous. Le nombre de caractères de la zone de texte Chaîne d'apprentissage doit correspondre au nombre de caractères segmentés.
- Apprendre nouveaux : spécifie que seuls les caractères nouveaux de la région seront appris. Les caractères à apprendre sont saisis dans la zone de texte Chaîne d'apprentissage, avant de cliquer sur le bouton Apprendre nouveaux. Le nombre de caractères de la zone de texte Chaîne d'apprentissage doit correspondre au nombre de caractères segmentés.
- Apprendre sélectionnés : spécifie que des caractères spécifiques de la région seront appris. Lorsque cette option est sélectionnée, la zone de texte Chaîne d'apprentissage est désactivée, et le bouton Apprendre sélectionnés entraîne l'affichage de la boîte de dialogue Ajouter les caractères sélectionnés à la police. Cette boîte de dialogue contient une image sans habillage de la région, ainsi qu'un nom et une zone de texte en dessous de chaque caractère segmenté. Le nom correspond au symbole actuellement associé au caractère (« ? » indique un caractère inconnu ou non appris). Une zone de texte est présente en dessous du nom. Saisissez le nom du caractère segmenté dans la zone de texte ; laissez le champ vide pour ne pas réapprendre le caractère. Cliquez sur le bouton Apprendre pour fermer la boîte de dialogue.
Après l'apprentissage, chaque caractère appris est visible dans l'arborescence, où il reçoit un dossier et un nom, et où les caractères sont regroupés (pour les caractères de même nom).
- Sélectionnez le dossier racine de la police pour afficher tous les caractères de la police dans le panneau à droite. Les caractères apparaissent sous forme d'icônes avec un nom en dessous.
- Sélectionnez un dossier de caractère pour afficher toutes les instances apprises de ce caractère dans le panneau à droite. Les caractères apparaissent sous forme d'icônes avec un nom en dessous.
- Sélectionnez l'instance apprise d'un caractère pour afficher ce caractère, dont la taille est ajustée au panneau à droite.
Astuce : doter l'outil de plusieurs instances d'apprentissage de chaque caractère à lire pendant l'exécution permet à la fonction de mieux faire la distinction entre les types de caractère similaires. Néanmoins, l'apprentissage de plusieurs instances des mêmes caractères présente des avantages et des inconvénients. L'avantage de l'apprentissage de plusieurs instances est le fait que les performances de classification sont généralement meilleures, en particulier pour la lecture de texte risquant d'être mal classé (par exemple, 8 et B). Les inconvénients liés à l'apprentissage de plusieurs instances sont : une diminution du délai d'exécution de la fonction ; la diminution éventuelle des scores de confiance, étant donné que l'apprentissage de plusieurs instances entraîne l'amélioration non seulement du score le plus élevé, mais également du second plus élevé ; et l'apprentissage éventuel de caractères incorrects.
- Importer : affiche la boîte de dialogue Ouvrir où une police, enregistrée comme fichier de données OCRMax (*.ocm), peut être importée.
- Exporter : affiche la boîte de dialogue Enregistrer sous où une police peut être enregistrée comme fichier de données (*.ocm).
- Renommer : cliquez sur ce bouton après avoir sélectionné un élément pour le renommer. Tout élément de l'arborescence ou du panneau de liste à droite peut être renommé.
Remarque : renommer un groupe de caractères modifie le nom de tous les caractères du groupe. Renommer un caractère unique modifie le nom de ce caractère unique sélectionné ; le caractère est déplacé vers un nouveau groupe ou un groupe différent de l'arborescence.
- Supprimer : cliquez sur ce bouton après avoir sélectionné un élément pour le supprimer de la police. Tout élément de l'arborescence ou du panneau de liste à droite peut être renommé.
Remarque : la suppression du dossier de la police supprime la police ; tous les caractères sont supprimés. La suppression d'un groupe de caractères supprime tous les caractères dont le nom correspond au nom du groupe supprimé.