【技术实现步骤摘要】
基于多尺度增强特征的文本识别方法、装置、设备及介质
[0001]本专利技术涉及文本识别
,属于智慧城市中对图像中所包含的文本信息进行智能识别的应用场景,尤其涉及一种基于多尺度增强特征的文本识别方法、装置、设备及介质。
技术介绍
[0002]OCR技术(Optical Character Recognition,光学字符识别)是一种通过对图像中信息进行智能化处理以从中识别出文本信息的技术方法,在发票识别、合同文件识别等众多场景中得到了广泛应用。传统识别方法均是从输入的图像中截取字符,并对字符对应的区域图像进行识别,从而获取其中的文本信息,然而这一技术方法仅是对单个字符进行单独识别然后拼接为对应的一段文本信息,在对字符进行单独识别时缺乏上下文语义信息及前后字符信息等与字符相关联的其他特征信息,导致识别得到的文本信息存在前后语义相斥、语义不通顺、语义脱离真实语境等诸多问题,影响了从图像中获取文本信息的准确性,导致对图像进行识别的可靠性无法满足实际需求。因此,现有对图像中文本信息进行识别的技术方法存在识别可靠性不高的问题。r/>
技术实现思路
<本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度增强特征的文本识别方法,其特征在于,包括:若接收到所输入的初始图像,根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图;根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征;根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分;根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征;根据预存的特征描述提取规则及所述关键基础区域特征从所述融合特征图中提取与所述关键基础区域特征对应的特征描述符;将所述特征描述符输入预置的文本识别模型进行识别,以得到对应的文本识别信息。2.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的卷积处理模型对所述初始图像进行卷积融合处理得到对应的融合特征图,包括:根据所述卷积处理模型对所述初始图像进行卷积处理,并获取所述卷积处理模型中多个卷积层分别对应的特征图;根据预存的分辨率信息对所述多个卷积层对应的特征图分别进行缩放处理,得到与所述分辨率信息相匹配的多个缩放特征图;对所述多个缩放特征图进行特征融合以得到对应的融合特征图。3.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的尺度信息中所包含的多种尺度,从所述融合特征图中截取与每一种所述尺度分别对应的基础区域特征,包括:对所述尺度信息中包含的多种像素尺寸及多种长宽比进行配对组合,以确定所述尺度信息中包含的多种尺度;从所述融合特征图中截取与每一所述尺度分别对应的基础区域特征。4.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述根据预置的文本预测模型对每一所述尺度对应的基础区域特征进行分类预测,以得到每一所述基础区域特征对应的分类预测得分,包括:将每一所述基础区域特征分别输入至所述文本预测模型,以通过所述文本预测模型中节点之间的关联公式分别对每一所述基础区域特征进行关联计算;从所述文本预测模型的输出层中分别获取与每一所述基础区域特征对应的分类预测得分。5.根据权利要求1所述的基于多尺度增强特征的文本识别方法,其特征在于,所述关键特征筛选规则包括重叠度计算公式及重叠度阈值,所述根据预置的关键特征筛选规则及所述分类预测得分对所述基础区域特征进行筛选,以筛选得到关键基础区域特征,包括:根据所述分类预测得分由低到高对所述基础区域特征进行排序得到初始特征排序信息;根据所述重叠度计算公式分别计算所述初始特征排序信息中每一基础区域特征与末尾基础区域特征之间的重叠度;
将所述末尾基础区域特征确定为关键区域特征;判断每一所述基础区域特征对应的重叠度是否不小于所述重叠度阈值,以根据判断结果从所述初始特征排序信息中筛除重叠度小于所述重叠度阈值的基础区域特征,得到特征排序更新信息;...
【专利技术属性】
技术研发人员:陈昊,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。