设置读取文本 (OCRMax) 识别工具
读取文本 (OCRMax) 识别工具的操作包括两个阶段:训练时间和运行时间。
- 训练时间包括加载要读取的多个字符图像,从图像中提取字符图像,进行分割,然后创建字符的训练字集数据库。
- 运行时间包括使 In-Sight 视觉系统联机,采集图像,以及根据训练的字集数据库提取字符并进行分类。
注意:开始设置工具前,应先加载训练图像。训练字集数据库时,Cognex 建议从最能代表字符效果的图像开始启动处理流程(即,首先使用最佳图像),按从最好到最差的顺序进行处理。
- 加载第一个训练图像。
- 将读取文本 (OCRMax) 识别工具添加到作业。
-
添加工具之后,需要在图像中配置区域。将工具的区域置于待读取的文本行之上:
- 区域的 X 轴应与文本基线平行,Y 轴应与字符的垂直笔画平行;如无倾斜,则 Y 轴垂直于 X 轴。
- X 轴的正向对应于读取方向。
- 区域中应该仅包含一个待读取的文本行以及部分周边背景。背景可以有干扰,并可存在明显的背景渐变/阴影。
- 在含有文本、打印清晰且干扰很少的图像中,区域可能明显比文本行大。
- 对于存在干扰的图像,文本行周围的区域应相对紧凑。
- 区域应尽可能地在各个方向均大于文本行至少半个字符的宽度(即,除非如此大的边界可能导致其它特征也含在区域中,否则均应留出这个范围),这几乎已成为经验法则。
注意:- 文本基线在图像中可以呈任何角度 (0-360),前提是区域以大约相同的角度定向。
- 除文本行外,区域不应包含图像中的任何其它重要特征。例如,区域不应部分包含邻近的其它文本行,或标记的边缘。
- 如果区域是弯曲的,该工具会自动将区域解开成拉直的输出区域,并加上“弯曲区域位置”标签。它可以被重新定位到图像中以用于显示。
-
工具将根据分割选项卡中的默认设置,自动在其认定为字符的“文本”周围创建字符区域。
-
如果该功能没有在文本周围正确绘制字符区域,则可使用以下两个方法:
- 使用“自动调整”对话框,并允许读取文本 (OCRMax) 识别工具自动计算最佳的分割设置。“自动调整”对话框会将分割和训练阶段合并为一个步骤。按照“自动调整”对话框主题中的说明,成功分割和训练字集数据库。
- 转到分割选项卡,调整参数,直至文本正确包含到各个字符区域中。按照分割流程,在训练前成功分割图像数据库中的所有字符。
完成文本分割后,即可准备训练字符并将其添加到字集。首先,转到设置选项卡,从字集库参数中选择一个字集,从而可以选择字集数据库。
- 如果创建新的自定义字集,则转到训练选项卡,输入待训练的准确文本字符串,然后按下全部训练按钮。字符将被添加并存储到选定的自定义字集中。
要向现有自定义字集添加更多字符,应采集或加载含有待训练字符的其它图像。如有必要,可重新配置区域和分割参数,确保对字符进行正确分割,然后按下训练选项卡中的训练新字符或训练选定字符按钮。
注意:自定义字集可作为作为以 OCRMax 数据文件 (*.ocm) 格式从训练选项卡中导入或导出。
注意:不能编辑预定义的 OCRA 或 OCRB 字集。