Outil d'identification Lire le texte (OCRMax) - Onglet Avancé
Définit la manière dont l'outil doit fusionner les fragments de caractère lors de la formation de caractères pendant la segmentation : Chevauchement requis (valeur par défaut), Définir l'écart minimal entre les caractères ou Définir les écarts minimal/maximal entre les caractères.
- Chevauchement requis : les fragments de caractère doivent se chevaucher horizontalement d'au moins un pixel pour être fusionnés.
- Définir l'écart minimal entre les caractères : les fragments de caractère présentant un écart horizontal entre eux peuvent être fusionnés pour former des caractères, où deux fragments dont l'écart est inférieur à la valeur définie dans le paramètre d'écart minimal entre les caractères seront fusionnés.
- Définir les écarts minimal/maximal entre les caractères : les fragments de caractère présentant un écart horizontal entre eux peuvent être fusionnés pour former des caractères, la décision de fusionner deux fragments étant basée sur les valeurs définies dans les paramètres d'écart minimal entre les caractères et d'écart maximal entre les caractères.
Définit la valeur fractionnaire minimale (0 à 100 ; valeur par défaut = 0) de chevauchement de deux fragments de caractère dans le sens des abscisses pour que les deux fragments soient considérés comme faisant partie du même caractère.
Définit la taille de l'écart maximal, en pixels (0 à 1 000 ; valeur par défaut = 5), pouvant se produire au sein d'un caractère unique, même pour les caractères endommagés.
Définit la taille de l'écart minimal, en pixels (0 à 1 000 ; valeur par défaut = 0), pouvant se produire entre deux caractères. L'écart est mesuré du bord droit du rectangle de caractère d'un caractère au bord gauche du rectangle de caractère du caractère suivant. Si l'écart entre deux fragments est inférieur à cette valeur, les fragments doivent être considérés comme faisant partie du même caractère, à moins que le caractère combiné ne soit trop grand (tel que spécifié par les paramètres Largeur maximale des caractères et/ou Rapport des caractères minimal).
Définit le nombre minimal de pixels du premier plan (c.-à-d. le texte) (0 à 1 000 ; valeur par défaut = 15) qu'un fragment doit avoir pour qu'il soit considéré comme pouvant être inclus dans un caractère. Un fragment de caractère est un blob dans l'image binarisée.
Définit le nombre minimal de pixels du premier plan (c.-à-d. le texte) (0 à 5 000 ; valeur par défaut = 30) qu'un fragment doit avoir pour être signalé.
Définit le mode utilisé pour normaliser l'image : Aucun, Global, Local ou Local avancé (valeur par défaut).
- Aucun : aucune normalisation n'est effectuée.
- Global : une normalisation globale est effectuée, en utilisant les informations de la région complète, et non des variations locales.
- Local : une normalisation locale est effectuée, en utilisant les informations relatives à chaque rectangle de caractère local de la région pour normaliser l'image.
- Local avancé : une normalisation locale est effectuée, en utilisant les informations relatives à chaque rectangle de caractère local de la région pour normaliser l'image, incluant les réglages non seulement de l'arrière-plan, mais également de contraste du premier plan.
Indique si tout ce qui n'a pas la même largeur de trait que le reste de l'image doit être supprimé de l'image normalisée (par défaut, ce paramètre est activé). Ce paramètre s'avère utile si, par exemple, les caractères semblent reliés les uns aux autres par de fines bandes de bruit. Néanmoins, l'utilisation de ce paramètre peut également entraîner la suppression incorrecte de caractères réels, si leur largeur de trait n'est pas cohérente.
Indique si la fonction ignore complètement les fragments touchant une des bordures de la région (par défaut, ce paramètre est désactivé). Ignorer de tels fragments peut être utile pour les caractéristiques non textuelles, telles que les bords d'étiquettes, pouvant être inclus dans la région.
Définit un modificateur de pourcentage (0 à 100 ; valeur par défaut = 50) dans la plage utilisée pour calculer le seuil de binarisation, dans l'image normalisée, qui binarise l'image entre le premier plan et l'arrière-plan.
Définit le contraste minimal [dans les niveaux de gris de l'image normalisée (0 à 255 ; valeur par défaut = 30)] qu'un fragment doit afficher, par rapport au seuil de binarisation, pour qu'il soit considéré comme pouvant être inclus dans un caractère.
Définit la distance, en pixels (0 à 1 000 ; valeur par défaut = 0), à laquelle un fragment peut être supprimé de la ligne principale longeant le texte horizontalement.
Définit le type de mode d'analyse des caractères à effectuer pour déterminer la segmentation optimale des caractères : Minimale ou Standard (valeur par défaut).
- Minimal : effectue une segmentation simple, selon les paramètres de segmentation.
- Standard : effectue une analyse de la ligne dans son ensemble, y compris l'espacement des caractères, pour déterminer la segmentation optimale.
Définit le pas minimal, en pixels (0 à 1 000 ; valeur par défaut = 0), pouvant se produire entre deux caractères, le pas étant calculé selon le paramètre Position du pas de caractères. Si le pas entre deux fragments est inférieur à cette plage, ils doivent être considérés comme faisant partie du même caractère, à moins que le caractère combiné ne soit trop grand (tel que spécifié par les paramètres Largeur maximale des caractères et/ou Rapport des caractères minimal). Le pas se définit comme la distance entre les points correspondants (approximativement) de deux caractères adjacents, et non la distance entre la fin d'un caractère et le début du caractère suivant (appelé écart entre les caractères).
Définit la manière dont le pas entre les caractères sera mesuré : Automatique (valeur par défaut), Gauche -> gauche, Centre -> Centre ou Droite -> droite.
- Si le paramètre Mode d'analyse de la segmentation est défini sur Minimal, il est désactivé.
- Les termes « gauche » et « droite » sont relatifs à l'axe de coordonnées défini par la région, « droite » correspondant au sens des abscisses positives.
- Automatique : indique qu'une unité métrique inconnue est utilisée ; le pas adéquat peut correspondre à n'importe laquelle des autres positions du pas, ou il n'existe pas de position constante du pas (comme ce peut être le cas avec une police de pas proportionnelle).
- Gauche -> gauche : indique que le pas est mesuré comme la distance entre le côté gauche du rectangle de caractère d'un caractère et le côté gauche du rectangle de caractère du caractère suivant.
- Centre à centre : indique que le pas est mesuré comme la distance entre le centre du rectangle de caractère d'un caractère et le centre du rectangle de caractère du caractère suivant.
- Droite -> droite : indique que le pas est mesuré comme la distance entre le côté droit du rectangle de caractère d'un caractère et le côté droit du rectangle de caractère du caractère suivant.
Indique l'unité métrique utilisée pour définir l'espacement des caractères. Automatique (valeur par défaut), Fixe, Proportionnel ou Variable.
- Automatique : indique que le type de pas est inconnu, mais que le type attendu est fixe ou proportionnel, et non variable.
- Fixe : indique que le pas est fixe, ce qui signifie que le pas entre n'importe quelle paire de caractères est constant, indépendamment de la largeur du rectangle de caractère des caractères. Le pas est mesuré selon le paramètre Position du pas de caractères.
-
Proportionnel : indique que le pas est proportionnel, ce qui signifie que le pas entre n'importe quelle paire de caractères dépend des caractères spécifiques.
Remarque :- Même si aucune mesure de pas n'est constante dans une chaîne, généralement l'écart entre les caractères, qui correspond à la distance entre le côté droit du rectangle de caractère d'un caractère et le côté gauche du rectangle de caractère du caractère suivant, est à peu près constante.
- Les termes « gauche » et « droite » sont relatifs à l'axe de coordonnées défini par la région, « droite » correspondant au sens des abscisses positives.
- Variable : indique qu'aucune unité métrique de distance entre caractères n'est cohérente dans une chaîne, autrement dit la position des caractères est irrégulière, et le pas n'est ni fixe, ni proportionnel.
Indique si l'outil effectue ou non une validation supplémentaire des caractères pendant la classification (ce paramètre est désactivé par défaut). Lorsque ce paramètre est désactivé, l'outil effectue une validation supplémentaire des caractères pendant la classification ; ceci réduit le risque d'erreurs de lecture (par exemple, la fausse acceptation d'un caractère).
Définit le type d'image de sortie à afficher : Image d'entrée (valeur par défaut), Image normalisée ou Image binarisée.
- Image d'entrée : l'image d'entrée active est affichée.
- Image normalisée : la version normalisée de l'image est affichée.
- Image binarisée : la version binarisée de l'image est affichée.