读取文本 (OCRMax) 识别工具 -分割选项卡
分割选项卡用于调整和修改在区域中分割字符的设置。一般情况下,默认值和设置可以读取大多数文本,不过,在更具挑战性的情况下,可能需要调整部分参数值。在这种情况下,指定字符最小宽度、最大宽度和/或最小间距(即字符到字符的距离,例如,从一个字符的左边缘到其后字符左边缘的距离),一般就可以解决问题。在遇到难以处理的情况时,为了加快字集数据库的创建,可使用自动调整按钮调出“自动调整”对话框,使工具自动计算最佳的分割设置。
- 含有纹理清晰的背景和/或含有大量图像噪音以致字符混合到背景中的图像将很难分割。
- 区域中应该仅包含要读取的字符,而不应包含任何无关的鲜明特征,如其它字符或标签边缘。
- 在两个字符粘连的情况下,很有可能需要调整参数。对于固定宽度的粘连字符,可通过指定字符宽度加以补偿;不过,带粘连字符的非等宽字集会很难处理,其对应的功能可以正确处理部分问题,但也有一部分问题无法解决。
- 对于涉及较短文本行(例如,只有三个字符或更少字符)或存在大量行抖动的相对较短的文本行的情况,指定预期的角度范围有助于该功能适当补偿确定短文本行定向过程中存在的固有不确定性。
- 字符行中的所有字符在定向和倾斜上必须一致。
- 对于分隔清晰的点阵打印(例如,点没有粘连),可能需要调整最小字符片段等参数以正确分割字符。
- 字符笔画宽度必须大于或等于两个像素。
- 较大字符(一般为字母数字字符)最小为 8 x 8 像素。较小字符(如句点)最小为 2 x 2 像素。
调出“自动调整”对话框,与“读取文本 (OCRMax) 识别”工具结合使用,对工具的分割参数进行配置,并通过构建“自动调整记录”创建“自动调整模型”,从而训练字集数据库。“自动调整记录”包含图像、训练字符串以及用户在图像中验证的字符位置。“自动调整模型”包含一项或多项“自动调整记录”,以及能够对“自动调整记录”中的所有图像进行最佳分割的设置。
- Cognex 建议,在使用“自动调整”对话框时,应在 In-Sight 模拟器而非 In-Sight 视觉系统上执行分割调整。读取文本 (OCRMax) 工具的“自动调整”算法需要使用大量计算资源,在模拟器上的执行效果要比在视觉系统上好。
- 在训练字集数据库并使用“自动调整”对话框分割字符时,Cognex 建议从最能代表字符效果的图像开始启动处理流程(即,首先使用最佳图像),按从最好到最差的顺序进行处理。这样有利于读取文本 (OCRMax) 工具的“自动调整”算法调整得更加成功。
在输入图像中定义字符极性:白底黑字、黑底白字或自动(默认)。
- 白底黑字:文本极性为白色背景、黑色文本。
- 黑底白字:文本极性为黑色背景、白色文本。
- 自动:工具将自动确定文本和背景的极性。
定义字集中的字符宽度应如何变化:自动(默认)、固定或可变。
- 自动:字符宽度未知;字集可能采用固定宽度或成比例宽度。
- 固定:字集中的所有字符矩形宽度均相同。
- 可变:字集中的字符可能具有宽度不同的字符矩形。
以像素为单位定义最小字符矩形宽度(1 - 1000;默认值 = 3),出现这个宽度时,必须对字符进行报告。
以像素为单位定义最小字符矩形高度(1 - 1000;默认值 = 3),出现这个高度时,必须对字符进行报告。
定义工具是否应考虑允许的最大字符矩形宽度(默认情况下,此参数处于禁用状态)。
以像素为单位定义最大字符矩形宽度(1 - 5000;默认值 = 100),出现这个宽度时,必须对字符进行报告。
定义工具是否应占有最大的字符矩形高度(默认情况下,此参数处于禁用状态)。
以像素为单位定义最大字符矩形高度(1 - 5000;默认值 = 100),出现这个高度时,必须对字符进行报告。
定义功能是否应考虑允许的最小字符纵横比,其中纵横比定义为整个字符行的高度除以字符矩形宽度(默认情况下,此参数处于启用状态)。
定义允许的最小字符纵横比(0-500;默认值 = 80)。
以度为单位定义角度搜索范围(0 - 45;默认值 = 0)。
以度为单位定义倾斜搜索范围(0 - 45;默认值 = 0)。
定义是否在图像上显示图形诊断数据。启用后,将围绕保留字符(绿色)、拒绝字符(红色)、保留片段(青色)、拒绝片段(黄色)、文本主线(蓝色)以及文本扩展主线(品红)绘制“区域”。