本申请涉及一种证件图像识别方法、装置及存储介质,属于计算机技术领域,该方法包括:获取待识别的证件图像,该证件图像包括待识别的字符区域;将证件图像输入预训练的检测模型,得到字符区域中字符的位置信息和分类结果;可以解决使用检测模型检测字符区域,使用识别模型识别字符区域中的字符时,占用的存储资源和计算资源均较多的问题;由于分类结果也为字符的识别结果,因此,可以直接将字符的分类结果作为字符的识别结果,只需要一个检测模型即可实现字符的检测和识别,且对于一张证件图像只需要计算一次,从而节省电子设备的存储资源和计算资源。
【技术实现步骤摘要】
证件图像识别方法、装置及存储介质
本申请涉及一种证件图像识别方法、装置及存储介质,属于计算机
技术介绍
随着互联网的快速发展,社会各界对信息安全问题的关注也与日俱增。尤其是智能手机的日益普及,移动警务执法越来越得到各个方面的重视,如何利用移动警务系统更好的服务于民众显得尤为重要。其中,证件图像的识别技术,也越来越多的受到关注并使用。一种典型的证件图像识别方法包括:获取证件图像;使用检测模型检测证件图像中的字符区域;使用识别模型识别字符区域中的字符。然而,检测模型和识别模型需要占用较多的设备存储资源,在运行时还需要消耗较多的计算资源。
技术实现思路
本申请提供了一种证件图像识别方法、装置及存储介质,可以解决使用检测模型检测字符区域,使用识别模型识别字符区域中的字符时,占用的存储资源和计算资源均较多的问题。本申请提供如下技术方案:第一方面,提供一种证件图像识别方法,所述方法包括:获取待识别的证件图像,所述证件图像包括待识别的字符区域;将所述证件图像输入预训练的检测模型,得到所述字符区域中字符的位置信息和分类结果,所述分类结果为字符的识别结果。可选地,所述检测模型是使用多组第一训练数据训练得到的,每组第一训练数据包括样本证件图像、所述样本证件图像中字符的位置标签、以及所述样本证件图像中字符的分类标签;其中,不同字符对应的分类标签不同,所述分类标签为对应字符的样本识别结果。可选地,所述位置标签包括每个字符对应的第一位置标签和所述字符区域的第二位置标签。可选地,所述检测模型基于轻量级的基础网络建立,所述基础网络的网络层数小于第一阈值、且通道数小于第二阈值;其中,所述第一阈值小于或等于现有的轻量级神经网络模型的最小层数;所述第二阈值小于或等于现有的轻量级神经网络模型的最小通道数。可选地,所述检测模型还包括与所述基础网络相连的基于中心点的检测网络CenterNet。可选地,所述将所述证件图像输入预训练的检测模型之前,还包括:将原始证件图像输入预训练的矫正模型,得到矫正后的证件图像,所述矫正后的证件图像为所述待识别的证件图像;其中,所述矫正模型是使用多组第二训练数据训练得到的,每组第二训练数据包括待矫正样本证件图像、矫正后的样本证件图像、以及所述矫正后的样本证件图像中关键点的标签位置,所述关键点包括所述矫正后的样本证件图像的边缘位置关键点和所述矫正后的样本证件图像内的预设位置关键点。可选地,所述矫正后的样本证件图像包括人脸图像区域,所述预设位置关键点包括所述人脸图像区域的人脸关键点。可选地,所述矫正模型基于轻量级的主干网络建立,所述主干网络的网络层数小于第三阈值、且通道数小于第四阈值;所述主干网络包括自定义的矫正层,所述矫正层用于将输入的关键点的位置矫正至标准位置;其中,所述第三阈值小于或等于现有的轻量级神经网络模型的最小层数;所述第四阈值小于或等于现有的轻量级神经网络模型的最小通道数。可选地,所述将所述证件图像输入预训练的检测模型,得到所述字符区域中字符的位置信息和分类结果之后,还包括:从对应关系中查找所述分类结果对应的字符,得到所述分类结果对应的字符;在第一显示区域显示所述证件图像;在第二显示区域显示所述字符。第二方面,提供一种证件图像识别装置,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现第一方面提供的证件图像识别方法。第三方面,提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序被处理器执行时用于实现第一方面提供的证件图像识别方法。本申请的有益效果至少包括:通过获取待识别的证件图像,该证件图像包括待识别的字符区域;将证件图像输入预训练的检测模型,得到字符区域中字符的位置信息和分类结果;可以解决使用检测模型检测字符区域,使用识别模型识别字符区域中的字符时,占用的存储资源和计算资源均较多的问题;由于分类结果也为字符的识别结果,因此,可以直接将字符的分类结果作为字符的识别结果,只需要一个检测模型即可实现字符的检测和识别,且对于一张证件图像只需要计算一次,从而节省电子设备的存储资源和计算资源。另外,通过在训练检测模型时,将分类标签同时作为识别标签使用,可以实现检测模型的检测和识别功能。另外,在训练检测模型时,位置标签包括每个字符对应的第一位置标签和字符区域的第二位置标签,可以实现字符区域的检测和每个字符位置的检测。另外,通过将检测模型设计为轻量级网络,使得检测模型整体较小,可以节省设备存储资源和计算资源。另外,通过在检测模型中设置CenterNet,由于CenterNet的检测准确性高于其它目标检测网络,且检测速度较快,因此,可以提高检测模型的检测准确性和速度。另外,通过在识别证件图像之前,使用矫正模型对该证件图像进行矫正;可以保证检测模型能够正确识别证件图像中的字符,提高识别准确率。另外,矫正模型除了使用图像边缘位置关键点进行训练,还结合图像内的预设位置关键点进行训练;可以使得证件图像的边缘丢失的情况下,矫正模型依然能够对该证件图像进行矫正,提高矫正模型的矫正准确性。另外,预设位置关键点包括人脸关键点,由于人脸关键点的检测的难度低于证件图像中其它位置的检测难度,因此,可以提高矫正模型的训练效率和矫正效率。另外,通过将矫正模型设计为轻量级网络,使得矫正模型整体较小,可以进一步节省设备存储资源和计算资源。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。【附图说明】图1是本申请一个实施例提供的证件图像识别方法的流程图;图2是本申请一个实施例提供的检测模型的结构示意图;图3是本申请一个实施例提供的矫正模型的结构示意图;图4是本申请又一个实施例提供的证件图像识别装置的框图;图5是本申请再一个实施例提供的证件图像识别装置的框图。【具体实施方式】下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。首先,对本申请涉及的若干名词进行介绍。基于中心点的检测网络(CenterNet):是一个端到端的目标检测器。目标检测要求检测出包含物体的最小矩形框。传统的目标检测器通常会罗列出大量的候选框并对其分类。而CenterNet将要检测的目标定位到一个点,即检测矩形框的中心点。换言之,CenterNet中,每个中心点对应一个目标的位置,不需要进行矩形框重叠(overlap)的判断,目标检测速度和效率均高于传统的目标检测器。基于本申请提出的技术问题,本申请提供一种识别证件图像的技术方案,本技术方案使用检测模型即可实现字符区域的检测和识别,而无需设置两种网络模型,可以节省电子设备的存储资源和计算资源本文档来自技高网...
【技术保护点】
1.一种证件图像识别方法,其特征在于,所述方法包括:/n获取待识别的证件图像,所述证件图像包括待识别的字符区域;/n将所述证件图像输入预训练的检测模型,得到所述字符区域中字符的位置信息和分类结果,所述分类结果为字符的识别结果。/n
【技术特征摘要】
1.一种证件图像识别方法,其特征在于,所述方法包括:
获取待识别的证件图像,所述证件图像包括待识别的字符区域;
将所述证件图像输入预训练的检测模型,得到所述字符区域中字符的位置信息和分类结果,所述分类结果为字符的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述检测模型是使用多组第一训练数据训练得到的,每组第一训练数据包括样本证件图像、所述样本证件图像中字符的位置标签、以及所述样本证件图像中字符的分类标签;
其中,不同字符对应的分类标签不同,所述分类标签为对应字符的样本识别结果。
3.根据权利要求2所述的方法,其特征在于,所述位置标签包括每个字符对应的第一位置标签和所述字符区域的第二位置标签。
4.根据权利要求1所述的方法,其特征在于,所述检测模型基于轻量级的基础网络建立,所述基础网络的网络层数小于第一阈值、且通道数小于第二阈值,所述检测模型还包括与所述基础网络相连的基于中心点的检测网络CenterNet;
其中,所述第一阈值小于或等于现有的轻量级神经网络模型的最小层数;所述第二阈值小于或等于现有的轻量级神经网络模型的最小通道数。
5.根据权利要求1所述的方法,其特征在于,所述将所述证件图像输入预训练的检测模型之前,还包括:
将原始证件图像输入预训练的矫正模型,得到矫正后的证件图像,所述矫正后的证件图像为所述待识别的证件图像;
其中,所述矫正模型是使用多组第二训练数据训练得到的,每组第二训练数据包括待矫正样本证件图像、矫正后的样...
【专利技术属性】
技术研发人员:孟祥昊,肖潇,付马,卢琨,梁婷,
申请(专利权)人:苏州科达科技股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。