设置读取文本 (OCRMax) 识别工具

训练读取文本 (OCRMax) 识别工具

加载第一个训练图像。
将读取文本 (OCRMax) 识别工具添加到作业。
添加工具之后，需要在图像中配置区域。将工具的区域置于待读取的文本行之上：
- 区域的 X 轴应与文本基线平行，Y 轴应与字符的垂直笔画平行；如无倾斜，则 Y 轴垂直于 X 轴。
- X 轴的正向对应于读取方向。
- 区域中应该仅包含一个待读取的文本行以及部分周边背景。背景可以有干扰，并可存在明显的背景渐变/阴影。
- 在含有文本、打印清晰且干扰很少的图像中，区域可能明显比文本行大。
- 对于存在干扰的图像，文本行周围的区域应相对紧凑。
- 区域应尽可能地在各个方向均大于文本行至少半个字符的宽度（即，除非如此大的边界可能导致其它特征也含在区域中，否则均应留出这个范围），这几乎已成为经验法则。
注意:
- 文本基线在图像中可以呈任何角度 (0-360)，前提是区域以大约相同的角度定向。
- 除文本行外，区域不应包含图像中的任何其它重要特征。例如，区域不应部分包含邻近的其它文本行，或标记的边缘。
- 如果区域是弯曲的，该工具会自动将区域解开成拉直的输出区域，并加上“弯曲区域位置”标签。它可以被重新定位到图像中以用于显示。
工具将根据分割选项卡中的默认设置，自动在其认定为字符的“文本”周围创建字符区域。
如果该功能没有在文本周围正确绘制字符区域，则可使用以下两个方法：
- 使用“自动调整”对话框，并允许读取文本 (OCRMax) 识别工具自动计算最佳的分割设置。“自动调整”对话框会将分割和训练阶段合并为一个步骤。按照“自动调整”对话框主题中的说明，成功分割和训练字集数据库。
- 转到分割选项卡，调整参数，直至文本正确包含到各个字符区域中。按照分割流程，在训练前成功分割图像数据库中的所有字符。
注意:
- 对于噪音图像以及难以读取的文本，可使用高级选项卡参数调整这种难以处理的情况。
- 如字符间存在空格，则应转到空格选项卡，调整参数以补偿空格。

分割后手动训练“读取文本 (OCRMax) 识别”工具

完成文本分割后，即可准备训练字符并将其添加到字集。首先，转到设置选项卡，从字集库参数中选择一个字集，从而可以选择字集数据库。

如果创建新的自定义字集，则转到训练选项卡，输入待训练的准确文本字符串，然后按下全部训练按钮。字符将被添加并存储到选定的自定义字集中。

要向现有自定义字集添加更多字符，应采集或加载含有待训练字符的其它图像。如有必要，可重新配置区域和分割参数，确保对字符进行正确分割，然后按下训练选项卡中的训练新字符或训练选定字符按钮。

注意:自定义字集可作为作为以 OCRMax 数据文件 (*.ocm) 格式从训练选项卡中导入或导出。

如果使用预定义的 OCRA 或 OCRB 字集，则只需将工具区域置于待读取的文本上，系统将根据定义的分割和高级参数设置，自动分割区域中的字符。

注意:不能编辑预定义的 OCRA 或 OCRB 字集。

运行时操作

获得训练的字集数据库后，工具即准备执行运行时操作。

设置工具的运行时检查模式，确定工具是仅读取其区域中的文本，还是读取并验证是否读取了正确的字符串。
在运行时过程中，In-Sight 视觉系统将处于联机状态，按作业定义采集图像。采集图像后，该图像中的文本字符串将根据分割参数自动分割，并将对照字符的已训练实例比较字符。