读取文本识别工具 - 设置选项卡
启动训练字集对话框,您可在此对话框定义和编辑字集(字符模型和其实例)。
定义工具的运行模式:读取、检验或读取和检验。
- 读取:该工具根据训练的字符模型解码文字字符串。解码的文本字符串必须与字段字符串参数中所定义的字符数匹配。
- 检验:该工具根据在匹配字符串参数中定义的文本字符串解码文本字符串。
- 读取和检验:该工具解码文本字符串并将已解码字符串与在匹配字符串参数中定义的字符串进行比较。已解码文本字符串必须与在匹配字符串参数中定义的字符串相匹配,方可归类为“通过”。
在后一种情况中,选择读取和检验模式时,工具会输出不匹配数据(Mismatch 和 Mismatch_Count),可供 EasyView 和其它通信设备在通信应用程序步骤中使用。可从选择 EasyView 项目对话框、选择 OPC 标记对话框或选择输入/输出数据对话框中选择不匹配数据。
当用户需要确定工具是否无法读取文本,或者可读取文本但与定义的匹配字符串不匹配时,不匹配数据非常有用。例如,工具无法读取文本时,可能是文本打印过程或视觉系统设置存在问题。当文本读取成功但与定义的匹配字符串不匹配时,可打印错误文本。
定义字集类型。您可以选择预先定义的字体类型(OCR-A 或 OCR-B,黑底白字或是白底黑字),或通过训练字符模型创建自定义字集。
针对读取操作定义文本字符串中包含的字符数。字段字符串中的每个字符对应 0 到 31 之间的检索位置(最大字符数)。“字段字符串”中的位置数必须等于文本字符串中的字符数。
字段字符串输入可能包括大写或小写文本、数字、破折号、点和空格。默认情况下,字段字符串中的每个位置均表示为“*”(字母数字“通配符”),这就意味着在此文本字符串中的那个位置处任意字符均有效。
在此字段字符串中的个别位置可能会被定义,因此该工具仅考虑在那个位置的可能字符串的子集,从而增加此工具的整体性能和可靠性。
| 字段字符串输入 | 说明 | 有效的字符 |
| * | 通配符 | 字集中任意训练的字符。 |
| N | 数字 | 0123456789 |
| A | 大写字母 | ABCDEFGHIJKLMNOPQRSTUVWXYZ |
| a | 小写字母 | abcdefghijklmnopqrstuvwxyz |
| H | 十六进制、大写字母和数字 | 0123456789ABCDEF |
| h | 十六进制、小写字母和数字 | 0123456789abcdef |
| O | 八进制 | 01234567 |
定义预期要读取的字符串(仅在模式参数设置为检验或读取和检验时启用)。输入该工具要解码的预期信息。
计算图像中的字符与字集库的训练字符模型之间的缩放差异(50% 至 200%)。“调整”按钮将仅在字符模型的大小和文本字符串中的字符之间的差异超过 ±5% 时可用。
为文本字符串中的各个字符定义最小可接受的分数(0-100;默认 = 70)。如果文本字符串中的任意字符低于“接受阈值”,则整个文本字符串将失败。
定义文本读取算法模式:速度或精确度。速度模式(默认为读取模式)在要求快速工具执行时间内处理良好、高对比度的图像时效果较好,而精确模式在不要求快速执行的工具处理困难较大、低对比度的图像时效果较好。
定义在字符的最高和第二高分数之间所要求的最小可接受的差异值(0-20;默认 = 0)。如果差异分数等于或低于差异接受值,则整个文本字符串将失败。
在与文本字符串混淆的图像中补充额外的特性(默认情况下,此选项为“关”或未选中)。在启用混淆背景时,工具的执行时间会略微增加。当区域中的其它功能在文本字符串的开始发生错误时,此选项尤其有用。
允许在字符缩放中进行变化(默认情况下,此选项为“关”或未选中)。
定义以毫秒为单位的时间量(0 到 30,000),工具搜索文本超过此时间量后将停止执行并返回“失败”。
显示从文本字符串中解码或验证的信息。