DL单字符检测

本节内容包含:

模块原理

单字符检测模块将定位与识别结合为一体,在定位的同时实现了字符识别;单字符检测的耗时受字符数量的干扰较小。为了便于将单字符聚集成文本,在单字符检测算法中内置文本行检测算法,并根据文本行信息将单字符聚集起来,形成完整的文本信息。此外,单字符检测也可识别弯曲文本,但需注意,单字符的检测目标是单个字符。

使用方法

DL单字符检测模块可用于获取输入图像源中的单个字符信息。当图像中有多行文本且使用定位和识别组合耗时较大时,或图像中文本分布较为分散或杂乱时,可以考虑使用DL单字符检测模块,可以减少识别过程耗时。

DL单字符检测与DL字符识别的用途基本一致,主要是在应用场景上存在差异,DL单字符检测更适合识别无法展开的弯曲字符、单个字符以及不规则文本行。

图 1 DL单字符检测应用场景

DL单字符检测模块的使用场景通常有以下两种:如果是做信息追溯应用,一般只需要保存字符即可,DL单字符检测模块与图像源模块配合使用即可完成字符定位识别功能;如果要判断字符打印是否正确,则需要与标准字符信息做对比,此时需要与字符比较模块配合使用,如下图所示。

图 2 DL单字符检测示例

参数配置

运行参数:

模型文件路径

此处会提供默认模型,用户也可以自行加载字符训练生成的模型文件。

方案存模型

使能后,将模型数据保存到方案文件或流程文件中,跨机加载方案时无需再次输入模型文件路径。

字符过滤

单击字符过滤会弹出字符过滤窗口,启用字符过滤后可设置自定义字符过滤信息。

  • 识别字符个数:表示每个文本行最多可输出的字符个数N,若实际识别出的字符数量M大于N,则只输出N个字符;若实际识别出的字符数量M小于等于N,则输出全部M个字符。

  • 设置字符类型:通过设置每一个字符所属的字符类型,并按照这些字符类型对输出的结果进行过滤。字符类型包括全部、数字(0~9)、大写字母(A~Z)、小写字母(a~z)、特殊字符、空格和自定义。

    说明:
    • 特殊字符:其覆盖范围为自定义字符类型中的特殊字符。

    • 自定义:可根据需求对已有字符库中的字符选择组合形式,完成设置后将鼠标放置在自定义设置框上可以显示已设定的组合形式。

图 3 字符过滤界面
最大查找个数

即最大查找的文本行个数。若实际检测出的文本行数量M小于最大查找个数N,则实际显示M个文本行;若实际检测出的文本行数量大于N,则实际只能显示N个文本行。

最小置信度

若检测结果的置信度(即识别内容为单个字符的概率)小于所设置的最小置信度,则不返回该字符识别结果;可根据实际需求进行设置,默认值为0.5。

最大重叠率

表示两个定位字符框之间的重叠面积与较小字符框面积之间的比值。当实际重叠率超过该参数值时,则不识别该字符;可根据实际需求设置,默认值为0.5。

目标排序

可选按中心点X坐标排序、按中心点Y坐标排序、按置信度排序。

  • 按中心点X/Y坐标排序:按照目标中心X/Y坐标从小到大对结果信息进行排序。

  • 按置信度排序:按照目标置信度从大到小对结果信息进行排序。

高级参数:

边缘筛选使能

使能后,需设置最小边缘分数。若查找目标在边缘内的部分占整体的比例小于最小边缘分数,则舍去该查找目标。

文本宽度使能

默认关闭状态,使能后需配置文本宽度范围,只会保留宽度符合设置范围的文本行。

文本高度使能

默认关闭状态,使能后需配置文本高度范围,只会保留高度符合设置范围的文本行。

模块结果

该模块的模块结果介绍请见DL单字符检测