读取文本识别 (OCRMax) 工具 - 自定义字段选项卡自定义字段选项卡为创建和编辑读取文本识别(OCRMax)工具中的字段字符串以及字段定义参数提供了图形化手段。由此产生的值将作为字符串常值插入到工具中。
自定义字段提供了验证和修正字符串的功能,并返回最佳匹配的有效字符串。自定义字段有两种主要用法:
自定义字段的一个典型用例为:当字符串含有前缀和/或后缀字符时,自定义字段会被用来忽略这些前缀/后缀字符。在这种情况下,字段字符串和字段定义将决定在区域内的字符串位移位置。
指定字符串中包含的字符数。字段字符串 entry can be any alphanumeric character found in the text entry dialog, including (A to Z), (a to z), (0 to 9), dashes (-), dots (.), and spaces ( ).
字段字符串中的每个字符对应 0 到 31 之间的检索位置。字段字符串必须和需要读取识别的字符串包含至少相同数目的字符位置。(例如:如果当前有10个字符,但是字段字符串仅指定了9个字符,那么最佳匹配的9个字符将被返回。然而,如果当前有8个 字符,而字段字符串定义了9个字符,则函数会返回#ERR)。默认情况下,任何字段字符串中的位置都由星号(*)字符或字母数字“通配符”表示。这意味着任何字符在字符串的任何位置都有效。
然而,字段字符串中的个别位置能被限制为只被认为是该位置可能字符的一个子集。这将增加整体运行性能和可靠性,因为不在一个位置的字符将不在读取时被考虑。
预先定义的字段字符串条目有:
|
字段字符串 条目 |
说明 |
有效的字符 |
|
* |
通配符 |
字集中任何训练过的字符。 |
|
N |
数字 |
0123456789 |
|
A |
大写字母 |
ABCDEFGHIJKLMNOPQRSTUVWXYZ |
|
a |
小写字母 |
abcdefghijklmnopqrstuvwxyz |
|
H |
十六进制、大写字母和数字 |
0123456789ABCDEF |
|
h |
十六进制、小写字母和数字 |
0123456789abcdef |
|
O |
八进制 |
01234567 |
|
注意:
|
如果字段字符串是**********AN,则字集中任何在字符串前10个字段字符串位置的字符都有效。但在第11个位置,仅大写的字母字符在读取时会被考虑。且在第12个位置,仅数字字符会被考虑。
字集中仅包含数字字符 0-9和 /。如果字段字符串是NN/NN/NN,在第一和第二、第四和第五以及第七和第八个位置,仅数字字符会被考虑。在第三和第六个位置,仅(/)字符会被考虑。
但是,如果字段字符串是NN/NN/AA,则读取会返回#ERR,因为字集中不含有任何字母字符。
在每个字符位置定义是否包含一个仅包括在字符自定义字段中指定的字符的结果。当启用时,字集中所有其它的字符将被忽略,不论它们的分类得分。
(可选的)字段定义设置能被用来创建字段字符串用户自定义条目。当字段字符串中包含这些条目时,这些条目限制了字符在被插入位置的有效字符列表。有几个预先定义的字段定义以及用户自定义的字段定义能被添加。预先定义的字段定义文本显示为灰色,且不能被删除或编辑。仅能选择启用或禁用。用户自定义的字段定义文本显示为黑色,能被添加,删除或编辑。如需添加一个字段定义,点击添加新定义按钮,为字符指定一个标识,然后为字符指定定义。
在字段定义条目中列出的字符必须是包含在字集中的。例如:如果1、2和3包含在用户训练字集中,那么#=123就是有效的。如果1、2和3不包含在用户训练字集中,那么#=123就将会无效。
注意:使用以下任一在字段定义参数中预定义的条目(*, A, a, N, H, h, O)将会导致在新定义中重新设置有效字符列表。
如果字段定义的值是#=123;$=3456;%=789且字段字符串是#$%*******,那么在第一个位置有效的字符只能是 1、2或者3。在第二个位置有效的字符只能是3、4、5或者6。在第三个位置,只有7、8或者9会有效。从第四到第十个位置,任何字集中的字符都有效。
如果字段定义的值是#=123;$=3456;%=789, A=A且字段字符串是#$%******A,那么在第一个位置有效的字符只能是 1、2或者3。在第二个位置有效的字符只能是3、4、5或者6。在第三个位置,只有7、8或者9会有效。从第四到第九个位置,任何字集中的字符都有效。在第十个位置,仅字符A会被考虑,因为字段定义A=A 重新设置了在字段字符串条目中的预定义。
字段字符串