Recherche ciblée
L’onglet Recherche ciblée offre un moyen graphique de créer et de modifier les paramètres Chaîne du champ et Définitions du champ de l’outil OCRMax. Les résultats sont insérés dans la fonction comme des chaînes littérales.
La fonction Recherche ciblée permet de vérifier et de corriger les chaînes, renvoyant les meilleures correspondances de chaînes valides. Cette fonction recouvre deux utilisations principales :
- La vérification des résultats OCR, selon laquelle la chaîne renvoyée est déterminée comme étant correcte ou non selon les paramètres Chaîne du champ et Définitions du champ.
- La correction des résultats OCR, selon laquelle la chaîne renvoyée ne figure pas dans la liste des résultats acceptables, et une tentative de recherche de chaîne acceptable autorisée par le champ le plus proche de la chaîne renvoyée est effectuée.
Une utilisation classique de la recherche ciblée est lorsque la chaîne contient des préfixes et/ou des suffixes, et que la recherche ciblée est utilisée pour ignorer ces préfixes/suffixes. Dans ce cas, les paramètres Chaîne du champ et Définitions du champ déterminent l’offset de la position de la chaîne dans la ROI.
Chaîne du champ
Détermine le nombre de caractères contenus dans la chaîne de caractères. Une entrée Chaîne du champ peut être tout caractère alphanumérique inclus dans la boîte de dialogue de l’éditeur de texte, dont les caractères (A à Z), (a à z), (0 à 9), le tiret (-), les points (.) et les espaces ( ).
Chaque caractère de la Chaîne du champ correspond à une position de champ indexée entre 0 et 31. La Chaîne du champ doit contenir au moins autant de positions qu’il y a de caractères dans la chaîne pour que la lecture réussisse (par exemple, si 10 caractères sont présents et que la Chaîne du champ ne spécifie que 9 caractères, les 9 meilleures correspondances sont renvoyées ; cependant, si 8 caractères sont présents et que la Chaîne du champ spécifie 9 caractères, la fonction renvoie #ERR). Par défaut, chaque position de la Chaîne du champ st représentée par un astérisque (*), c’est-à-dire un « caractère générique » alphanumérique. Ceci signifie que tout caractère est valide à toute position de la chaîne.
Cependant, une position particulière de la Chaîne du champ peut être limitée afin de ne prendre en compte qu’un sous-ensemble de caractères possibles à cette position. Cela permet d’augmenter les performances et la fiabilité de l’opération car les caractères qui ne sont pas acceptables à une position ne seront pas pris en compte lors d’une lecture.
Les entrées de Chaîne du champ prédéfinies sont les suivantes :
|
Entrée Chaîne du champ |
Description |
Caractères valides |
|---|---|---|
|
* |
Caractère générique |
Tout caractère appris dans la police. |
|
N |
Numérique |
0123456789 |
|
A |
Alphabétique en majuscules |
ABCDEFGHIJKLMNOPQRSTUVWXYZ |
|
a |
Alphabétique en minuscules |
abcdefghijklmnopqrstuvwxyz |
|
H |
Hexadécimal, alphabétique en majuscules et numérique |
0123456789abcdef |
|
h |
Hexadécimal, alphabétique en minuscules et numérique |
0123456789abcdef |
|
O |
Octal |
01234567 |
Exemple 1 de chaîne du champ
Si la Chaîne du champ est **********AN, tous les caractères de la police sont valides dans les 10 premières positions de Chaîne du champ. A la onzième position, seuls les caractères alpha majuscules sont pris en compte lors de la lecture. A la douzième position, seuls des caractères numériques sont pris en considération.
Exemple 2 de chaîne du champ
La police ne contient que les caractères numériques 0-9 et le caractère /. Si la Chaîne du champ est NN/NN/NN, seuls les caractères numériques seront pris en compte aux première et deuxième, quatrième et cinquième, septième et huitième positions. Seule la barre oblique (/) sera prise en considération aux troisième et sixième positions.
Cependant, si la Chaîne du champ est NN/NN/AA, la lecture renvoie #ERR car la police ne contient pas de caractères alpha.
Définition de champs
Vous pouvez utiliser le paramètre Définition du champ pour créer des entrées personnalisées pour la Chaîne du champ. Lorsqu’elles sont incluses dans la Chaîne du champ, ces entrées limitent la liste des caractères valides aux positions auxquelles elles sont insérées. Il existe plusieurs définitions du champ prédéfinies, et des définitions du champ définies par l’utilisateur peuvent être ajoutées. Les définitions prédéfinies apparaissent en gris et ne peuvent pas être supprimées ou modifiées, seulement activées ou désactivées. Les définitions définies par l’utilisateur apparaissent en noir et peuvent être ajoutées, supprimées ou modifiées. Pour ajouter une définition du champ, cliquez sur Ajouter nouvelle, affectez une icône et une définition au caractère.
- Le nombre de définitions établies par l’utilisateur est limité par la longueur de l’expression de la fonction OCRMax (249).
- Toutes les définitions définies par l’utilisateur désactivées lorsque la feuille de propriétés OCRMax est fermée sont supprimées et ne seront pas disponibles lors de la réouverture de la feuille de propriétés de la fonction.
- Si le paramètre Définition du champ de l’onglet Général est défini en tant que Références à des cellules, l’option Définition du champ de l’onglet Recherche ciblée est désactivée et la valeur actuelle de la référence de cellule est affichée.
Les caractères listés pour une entrée de Définitions du champ doivent être inclus dans la police. Par exemple : #=123 est valide si 1, 2 et 3 se trouvent dans la police apprise par l’utilisateur. Cependant, #=123 est incorrect si 1, 2 et 3 ne font pas partie de la police.
Exemple 1 de définitions du champ
Si la valeur de Définitions du champ est #=123;$=3456;%=789, et que celle de Chaîne du champ est #$%*******, les seuls caractères valides en première position seront 1, 2 ou 3. Les seuls caractères valides en deuxième position seront 3, 4, 5 ou 6. En troisième position, seuls 7, 8, ou 9 seront valides. Tous les caractères de la police sont valides de la quatrième à la dixième position.
Exemple 2 de définitions du champ
Si la valeur de Définitions du champ est #=123;$=3456;%=789, A=A et que celle de Chaîne du champ est #$%******A, les seuls caractères valides en première position seront 1, 2 ou 3. Les seuls caractères valides en deuxième position seront 3, 4, 5 ou 6. En troisième position, seuls 7, 8, ou 9 seront valides. Tous les caractères de la police sont valides de la quatrième à la neuvième position. Seul le caractère A sera pris en compte à la dixième position car la Définition du champ A=A remappe l’entré Chaîne du champ prédéfinie.
Paramètres des champs Chaîne
- Correspondance avec les caractères de la chaîne de champ uniquement : Indique si la fonction doit ou non essayer de faire correspondre les caractères avec les caractères indiqués dans Chaîne du champ.
- Chaînes de longueur variable : Indique si la chaîne du champ définie peut être une sous-chaîne dans la chaîne de texte lue complète. Si une sous-chaîne est trouvée, le système renvoie la sous-chaîne qui correspond le mieux.
- Longueur minimale : Lorsque le paramètre Chaînes de longueur variable est activé, ce paramètre spécifie la longueur de chaîne minimale acceptable (0 à 100 ; par défaut = 1).
- Longueur maximale : Lorsque le paramètre Chaînes de longueur variable est activé, ce paramètre spécifie la longueur de chaîne maximale acceptable (0 à 100 ; par défaut = 100).
- Index de début maximum : Lorsque le paramètre Chaînes de longueur variable est activé, ce paramètre indique les sous-séquences de recherche ciblée à prendre en compte, devant commencer à une position inférieure ou égale à cette valeur d’index (0 à 100 ; par défaut = 100).
- Index de fin minimum : Lorsque le paramètre Chaînes de longueur variable est activé, ce paramètre indique les sous-séquences de recherche ciblée à prendre en compte, devant se terminer à une position supérieure ou égale à cette valeur d’index (0 à 100 ; par défaut = 0).