本申请提供一种字符识别方法及装置、电子设备、计算机可读存储介质,方法包括:采集待识别图像;将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。本申请通过依据深度学习的方法以定位加分类的方式,提高了复杂背景下字符识别正确率。
【技术实现步骤摘要】
字符识别方法及装置、电子设备、存储介质
本申请涉及图像处理
,特别涉及一种字符识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
光学字符识别(OCR,OpticalCharacterRecognition)是指电子设备通过检测图像上字符暗、亮的模式确定其形状,从而将形状翻译成计算机文字的过程。光学字符识别被广泛地应用于生产和生活的各类场景中。简单背景下的光学字符识别的正确率已经可以满足应用的需求,而对于复杂背景,识别正确率仍有较大的提升空间。
技术实现思路
本申请实施例的目的在于提供一种字符识别方法及装置、电子设备、计算机可读存储介质,用于提高复杂背景下的字符识别正确率。一方面,本申请提供了一种字符识别方法,包括:采集待识别图像;将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。在一实施例中,所述将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像中的字符位置信息,包括:将所述待识别图像作为所述目标检测网络的输入,通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果;其中,所述边界框预测结果包括中心点相对坐标、边界框置信度;筛选所述边界框置信度大于第一阈值的边界框预测结果,作为边界框识别结果;基于所述边界框识别结果对应单元格的位置信息,将所述边界框识别结果中的中心点相对坐标调整为中心点坐标,得到所述字符位置信息。在一实施例中,所述目标检测网络,通过如下方式训练得到:将第一训练集中第一样本图像作为深度学习网络的输入,获得所述第一样本图像中的字符位置预测结果;其中,所述第一样本图像携带字符位置标签;通过所述字符位置预测结果和所述字符位置标签计算置信度评分;依据所述字符位置预测结果和所述字符位置标签之间的差异,以及所述置信度评分,调整所述深度学习网络的网络参数;重复上述过程,直至所述深度学习网络收敛,得到所述目标检测网络。在一实施例中,所述从所述待识别图像裁切与所述字符位置信息对应的待识别子图像,包括:基于所述字符位置信息、预设裁切宽度和预设裁切高度,对所述待识别图像进行裁切,得到待识别子图像。在一实施例中,所述分类网络,通过如下方式训练得到:将第二训练集中第二样本图像作为深度学习网络的输入,获得对应于所述第二样本图像的分类结果;其中,所述第二样本图像携带字符标签;通过所述字符标签和所述分类结果之间的差异,调整所述深度学习网络的网络参数;重复上述过程,直至所述深度学习网络收敛,得到所述分类网络。在一实施例中,所述依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果,包括:依据所述字符位置信息确定字符之间的相对位置关系;基于所述相对位置关系和预设字符次序对字符进行排序,将排序后的字符串作为字符识别结果。在一实施例中,在将排序后的字符串作为字符识别结果之前,所述方法还包括:判断排序后的字符串中是否存在预设单位字符;若存在,基于所述单位字符拆分所述字符串,得到至少两个字符串。另一方面,本申请还提供了一种字符识别装置,包括:采集模块,用于采集待识别图像;定位模块,用于将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;裁切模块,用于从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;识别模块,用于将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;排序模块,用于依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。进一步,本申请还提供了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述字符识别方法。另外,本申请还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述字符识别方法。在本申请实施例中,通过目标检测网络识别出待识别图像中的字符位置信息后,裁切出与字符位置信息对应的待识别子图像,减少了图像中复杂背景对分类网络的干扰,使得分类网络可以关注待识别子图像中的信息,分类计算出字符,依据字符位置信息对字符排序后,获得字符识别结果;本申请通过依据深度学习的方法以定位加分类的方式,提高了复杂背景下字符识别正确率。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。图1为本申请一实施例提供的应用场景示意图;图2为本申请一实施例提供的电子设备的结构示意图;图3为本申请一实施例提供的字符识别方法的流程示意图;图4为本申请一实施例提供的目标检测网络的训练方法的流程示意图;图5为本申请一实施例提供的分类网络的训练方法的流程示意图;图6为本申请一实施例提供的字符识别装置的框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。图1为本申请一实施例提供的字符识别方法的应用场景示意图。如图1所示,该应用场景包括服务端30和客户端20,服务端30可以是服务器、服务器集群或者云计算中心,服务端30可以对客户端20采集的电子器件表面的图像执行字符识别的业务。客户端20可以是摄像头、智能手机、平板电脑等智能设备。如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30。存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(StaticRandomAccessMemory,简称SRAM),电可擦除可编程只读存储器(ElectricallyErasableProgrammableRead-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasab本文档来自技高网...
【技术保护点】
1.一种字符识别方法,其特征在于,包括:/n采集待识别图像;/n将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;/n从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;/n将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;/n依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。/n
【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:
采集待识别图像;
将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;
从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;
将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;
依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像中的字符位置信息,包括:
将所述待识别图像作为所述目标检测网络的输入,通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果;其中,所述边界框预测结果包括中心点相对坐标、边界框置信度;
筛选所述边界框置信度大于第一阈值的边界框预测结果,作为边界框识别结果;
基于所述边界框识别结果对应单元格的位置信息,将所述边界框识别结果中的中心点相对坐标调整为中心点坐标,得到所述字符位置信息。
3.根据权利要求1所述的方法,其特征在于,所述目标检测网络,通过如下方式训练得到:
将第一训练集中第一样本图像作为深度学习网络的输入,获得所述第一样本图像中的字符位置预测结果;其中,所述第一样本图像携带字符位置标签;
通过所述字符位置预测结果和所述字符位置标签计算置信度评分;
依据所述字符位置预测结果和所述字符位置标签之间的差异,以及所述置信度评分,调整所述深度学习网络的网络参数;
重复上述过程,直至所述深度学习网络收敛,得到所述目标检测网络。
4.根据权利要求1所述的方法,其特征在于,所述从所述待识别图像裁切与所述字符位置信息对应的待识别子图像,包括:
基于所述字符位置信息、预设裁切宽度和预设裁切高度,对所述待识别图像进行裁切,得到待识别子图像。
5.根据权...
【专利技术属性】
技术研发人员:张耀营,鄢丽萍,高文强,马祥,徐众,孟小路,
申请(专利权)人:苏州杰锐思智能科技股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。