基于多尺度增强特征的文本识别方法、装置、设备及介质制造方法及图纸

技术编号:32283410 阅读:18 留言:0更新日期:2022-02-12 19:51
本发明专利技术公开了基于多尺度增强特征的文本识别方法、装置、设备及介质,方法包括:对所输入的初始图像进行卷积融合处理得到融合特征图并从中截取多种尺度分别对应的基础区域特征,对每一基础区域特征进行分类预测得到对应的分类预测得分,根据分类预测得分对基础区域特征进行筛选得到关键基础区域特征,并根据关键基础区域特征从融合特征图中提取得到对应的特征描述符后输入文本识别模型,以识别得到文本识别信息。本发明专利技术属于文本识别技术领域,基于关键基础区域特征的尺度进行关联放大以从融合特征图中获取包含关联区域特征的特征描述符,可从初始图像中获取对应的上下文语义信息及前后字符信息的关联特征,大幅提高了对文本信息进行识别的可靠性。文本信息进行识别的可靠性。文本信息进行识别的可靠性。

【技术实现步骤摘要】
基于多尺度增强特征的文本识别方法、装置、设备及介质


[0001]本专利技术涉及文本识别
,属于智慧城市中对图像中所包含的文本信息进行智能识别的应用场景,尤其涉及一种基于多尺度增强特征的文本识别方法、装置、设备及介质。

技术介绍

[0002]OCR技术(Optical Character Recognition,光学字符识别)是一种通过对图像中信息进行智能化处理以从中识别出文本信息的技术方法,在发票识别、合同文件识别等众多场景中得到了广泛应用。传统识别方法均是从输入的图像中截取字符,并对字符对应的区域图像进行识别,从而获取其中的文本信息,然而这一技术方法仅是对单个字符进行单独识别然后拼接为对应的一段文本信息,在对字符进行单独识别时缺乏上下文语义信息及前后字符信息等与字符相关联的其他特征信息,导致识别得到的文本信息存在前后语义相斥、语义不通顺、语义脱离真实语境等诸多问题,影响了从图像中获取文本信息的准确性,导致对图像进行识别的可靠性无法满足实际需求。因此,现有对图像中文本信息进行识别的技术方法存在识别可靠性不高的问题。

技术实现思路

[0003]本专利技术实施例提供了一种基于多尺度增强特征的文本识别方法、装置、设备及介质,旨在解决现有技术对图像中文本信息进行识别的技术方法所存在的识别可靠性不高的问题。
[0004]第一方面,本专利技术实施例提供了一种基于多尺度增强特征的文本识别方法,方法包括:
[0005]若接收到所输入的初始图像,根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图;
[0006]根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征;
[0007]根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分;
[0008]根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征;
[0009]根据预存的特征描述提取规则及所述关键基础区域特征从所述融合特征图中提取与所述关键基础区域特征对应的特征描述符;
[0010]将所述特征描述符输入预置的文本识别模型进行识别,以得到对应的文本识别信息。
[0011]第二方面,本专利技术实施例提供了一种基于多尺度增强特征的文本识别装置,其包括:
[0012]融合特征图获取单元,用于若接收到所输入的初始图像,根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图;
[0013]基础区域特征获取单元,用于根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征;
[0014]分类预测得分获取单元,用于根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分;
[0015]基础区域特征筛选单元,用于根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征;
[0016]特征描述符获取单元,用于根据预存的特征描述提取规则及所述关键基础区域特征从所述融合特征图中提取与所述关键基础区域特征对应的特征描述符;
[0017]文本识别信息获取单元,用于将所述特征描述符输入预置的文本识别模型进行识别,以得到对应的文本识别信息。
[0018]第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于多尺度增强特征的文本识别方法。
[0019]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于多尺度增强特征的文本识别方法。
[0020]本专利技术实施例提供了一种基于多尺度增强特征的文本识别方法、装置、设备及介质。对所输入的初始图像进行卷积融合处理得到融合特征图并从中截取多种尺度分别对应的基础区域特征,对每一基础区域特征进行分类预测得到对应的分类预测得分,根据分类预测得分对基础区域特征进行筛选得到关键基础区域特征,并根据关键基础区域特征从融合特征图中提取得到对应的特征描述符后输入文本识别模型,以识别得到对应的文本识别信息。通过上述方法,基于关键基础区域特征的尺度进行关联放大以从融合特征图中获取包含关联区域特征的特征描述符,可从初始图像中获取对应的上下文语义信息及前后字符信息的关联特征,大幅提高了对文本信息进行识别的可靠性。
附图说明
[0021]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的流程示意图;
[0023]图2为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的子流程示意图;
[0024]图3为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的另一子流程示意图;
[0025]图4为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的另一子流程示意图;
[0026]图5为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的另一子流程示
意图;
[0027]图6为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的另一子流程示意图;
[0028]图7为本专利技术实施例提供的基于多尺度增强特征的文本识别方法的另一流程示意图;
[0029]图8为本专利技术实施例提供的基于多尺度增强特征的文本识别装置的示意性框图;
[0030]图9为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0031]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0033]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0034]还应当进一步理解,在本专利技术说明书和所附权利要求本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度增强特征的文本识别方法,其特征在于,包括:若接收到所输入的初始图像,根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图;根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征;根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分;根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征;根据预存的特征描述提取规则及所述关键基础区域特征从所述融合特征图中提取与所述关键基础区域特征对应的特征描述符;将所述特征描述符输入预置的文本识别模型进行识别,以得到对应的文本识别信息。2.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图,包括:根据所述卷积处理模型对所述初始图像进行卷积处理,并获取所述卷积处理模型中多个卷积层分别对应的特征图;根据预存的分辨率信息对所述多个卷积层对应的特征图分别进行缩放处理,得到与所述分辨率信息相匹配的多个缩放特征图;对所述多个缩放特征图进行特征融合以得到对应的融合特征图。3.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征,包括:对所述尺度信息中包含的多种像素尺寸及多种长宽比进行配对组合,以确定所述尺度信息中包含的多种尺度;从所述融合特征图中截取与每一所述尺度分别对应的基础区域特征。4.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分,包括:将每一所述基础区域特征分别输入至所述文本预测模型,以通过所述文本预测模型中节点之间的关联公式分别对每一所述基础区域特征进行关联计算;从所述文本预测模型的输出层中分别获取与每一所述基础区域特征对应的分类预测得分。5.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述关键特征筛选规则包括重叠度计算公式及重叠度阈值,所述根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征,包括:根据所述分类预测得分由低到高对所述基础区域特征进行排序得到初始特征排序信息;根据所述重叠度计算公式分别计算所述初始特征排序信息中每一基础区域特征与末尾基础区域特征之间的重叠度;
将所述末尾基础区域特征确定为关键区域特征;判断每一所述基础区域特征对应的重叠度是否不小于所述重叠度阈值,以根据判断结果从所述初始特征排序信息中筛除重叠度小于所述重叠度阈值的基础区域特征,得到特征排序更新信息;...

【专利技术属性】
技术研发人员:陈昊
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1