读取文本识别(OCRMax)工具 - 高级选项卡
定义了在分段过程形成字符时,该工具应如何合并字符片段:要求重叠(默认),设置字符间最小间距或设置字符间最小间距/最大字符内间距。
- 要求重叠:字符片段必须平行重叠至少一个像素以被合并。
- 设置字符间最小间距:中间有一个平行间距的字符片段可以被合并来形成字符。任何两个片段间距小于在“设置字符间最小间距”参数中定义的值都将被合并。
- 设置字符间最小间距/最大字符内间距: 中间有一个平行间距的字符片段可以被合并来形成字符。两个字符合并的决定将由在字符间最小间距和最大字符内间距参数中定义的值来决定。
定义了两个字符片段必须在X方向互相重叠的最小分数(0 - 100;默认 = 0),以使两个片段被视为同一字符的一部份。
定义了能在单个字符(即使是破损的字符)间存在的最大间距,以像素为单位(0 - 1000;默认 = 5)。
定义了能在两个字符间存在的最小间距,以像素为单位(0 - 1000;默认 = 0)。间距的测量从一个字符的字符矩形右边缘开始到下一个字符的字符矩形左边缘结束。如果两个片段间的间距小于该值,则片段必须被视为是同一字符的一部分。除非合并后的字符将太宽(由最大字符宽度和/或最小字符长宽比率参数所指定)。
定义为了被视为可能列入字符的一个片段所必需的最小前景数(即文本)像素(0 - 1000;默认 = 15)。一个字符片段就是一个在二值化图像中的对象。
定义为了被报告一个字符所必需的最小前景数(即文本)像素(0 - 5000;默认 = 30)。
定义了用于标准化图像的模式:无、全局、本地或本地高级(默认)。
- 无:将不会执行任何标准化。
- 全局:全局标准化已执行,请使用所有区域内的信息,不要使用本地变量。
- 本地:本地标准化已执行,请使用区域内有关本地字符矩形的信息来标准化图像。
- 本地高级:本地标准化已执行,请使用区域内有关本地字符矩形的信息来标准化图像,这不仅包括调整背景,还包括调整前景对比度。
定义了是否要从标准化图像中删除所有不包含与其余图像相同笔画宽度的部分(默认情况下,该设置已被启用)。该设置在诸如字符间的相互连接显示混乱等情况非常有帮助。然而,使用此设置也可能会错误地删除正确字符,如果它们的笔画宽度不一致。
定义了函数是否完全忽略任何与边界区域接触的片段(在默认情况下,该设置已被启用)。忽略这些片段在诸如可能包括在区域内的标签的边缘等非文本特性的情况非常有帮助。
定义了二值化前景和背景的标准化图像中用于计算二值化阈值百分比范围的调整(0 - 100;默认 = 50)。
定义为了被视为可能包含在一个字符内,相对于二值化阈值一个片段所必须拥有的最小对比度[标准化图像灰度级别(0 - 255;默认 = 30)]。
定义了可能从“主线”在文本内平行运行中删除的片段,以像素为单位(0 - 1000; 默认 = 0)
定义了用于确定最佳字符分割而运行的字符分析模式的类型:最小或标准(默认)。
- 最小:根据分段参数来运行直接分割,。
- 标准:对行作为整体进行分析(包括字符空间)以确定最佳分段。
定义了能在两个字符间出现的,根据字符节距(pitch)位置参数来计算的最小节距(pitch),以像素为单位(0 - 1000;默认 = 0)。如果两个片段间的节距小于该值,则片段必须被视为是同一字符的一部分。除非合并后的字符将太宽(由最大字符宽度和/或最小字符长宽比率参数所指定)。节距(pitch)被定义为相邻的字符的对应点(大约)之间的距离,而不是从一个字符结束到下一个字符开始之间的距离(这被称为字符间间距)。
定义了如何测量字符间的节距(pitch):自动(默认)、 左到左、中心到中心或右到右。
- 如果分段分析模式 参数被设置成 最小,那么该参数将被禁用。
- 术语“左”和“右”与区域定义的坐标轴相对应。例如:“右”相当于 X 的正方向。
- 自动:指定了一个未知度量标准正在被使用;适当的节距(pitch)可能是任何其它节距(pitch)位置,或者没有一个恒定的节距(pitch)(可能是一个比例节距(pitch)字集)。
- 左到左:指定了节距(pitch)将从字符的字符矩形左侧开始到相邻的字符的字符矩形左侧进行测量。
- 中心到中心:指定了节距(pitch)将从字符的字符矩形中心开始到相邻的字符的字符矩形中心进行测量。
- 右到右:指定了节距(pitch)将从字符的字符矩形右侧开始到相邻的字符的字符矩形右侧进行测量。
定义了用来定义字符间空间的度量标准:自动(默认)、固定、按比例或变量。
- 自动: 指定了节距(pitch)类型是未知,但是节距(pitch)类型预计将是固定或按比例,且不是变量。
- 固定:指定节距(pitch)是固定的,也就是在任何一对字符间的节距(pitch)是恒定的(不论字符的字符矩形有多宽)。节距(pitch)将基于字符节距(pitch)位置参数来测量。
-
按比例:指定节距(pitch)是按比例的,也就是在任何一对字符间的节距(pitch)取决于特定的字符。
注意:- 尽管没有节距(pitch)的测量在字符串中是恒定的,往往字符间的间距,也就是从字符的字符矩形右侧到相邻字符的字符矩形左侧的距离是大约恒定的。
- 术语“左”和“右”与区域定义的坐标轴相对应。例如:“右”相当于 X 的正方向。
-
变量:指定没有字符到字符的距离度量标准在字符串中是始终一致的,即字符位置是不稳定的、且节距(pitch)既不是固定的也不是按比例的。
注意:变量节距(pitch)与自动是不同的。因为自动假设节距(pitch)是固定的或按比例的,但这并不可知。
定义工具是否要在分类过程中进行附加字符验证(默认情况下,该参数被禁用)。当该功能关闭时,工具将在分类过程中进行附加字符验证,这将降低误读的几率(例如错误地接受一个字符)。
定义了应该被显示的输出图像类型:输入图像(默认)、 标准化图像或二值图像。
- 输入图像:当前的输入图像将被显示。
- 标准化图像:标准化版本的图像将被显示。
- 二值图像:二值版本的图像将被显示。