一种基于目标检测的验证码识别方法及装置制造方法及图纸

技术编号:26764508 阅读:34 留言:0更新日期:2020-12-18 23:40
本发明专利技术实施例提供一种基于目标检测的验证码识别方法及装置,该方法包括:将接收的验证码图片输入目标检测网络,输出数据包括与每个字符对应的至少一个预测结果,预测结果包括预测字符、预测字符的坐标信息及预测置信度信息;选取预测结果中预测置信度信息大于预设阈值的多个预测结果,并将多个预测结果中的预测字符按照坐标信息进行排序,从而得到验证码识别结果。本发明专利技术实施例提供的基于目标检测的验证码识别方法及装置,可以实现对验证码图片中的字符的顺序进行识别,可以区分验证码图片中的相同字符,并且识别过程不受到验证码长度的限制,验证码长度可以任意,由此,大大提高了验证码识别的精度和灵活性。

【技术实现步骤摘要】
一种基于目标检测的验证码识别方法及装置
本专利技术涉及人工智能
,具体涉及一种基于目标检测的验证码识别方法及装置。
技术介绍
现有的验证码识别方法主要为通过人工标注制作训练集,然后利用分类网络进行分类识别。其中,在人工标注时标注好验证码中包含的字符、数字等,且每个训练样本图片中的字符的个数通常是相同的。利用这种训练方法训练出的验证码识别模型的识别精度较低,表现在验证码字符顺序预测精度低、包含相同字符的验证码的预测精度低等,并且验证码长度不可任意设置,灵活性较差。
技术实现思路
为解决现有技术中的问题,本专利技术实施例提供一种基于目标检测的验证码识别方法及装置。第一方面,本专利技术实施例提供一种基于目标检测的验证码识别方法,该方法包括:将接收的验证码图片输入到预先训练好的目标检测网络,所述目标检测网络的输出数据包括与所述验证码图片中的每个字符对应的至少一个预测结果,所述预测结果包括预测字符、所述预测字符的坐标信息及预测置信度信息;其中,所述目标检测网络是以验证码样本图片作为输入,以包含所述验证码样本图片中各个字符及各个字符的坐标信息的输出标签训练得到;选取所述预测结果中所述预测置信度信息大于预设阈值的多个预测结果,并将所述多个预测结果中的所述预测字符按照所述坐标信息进行排序,从而得到验证码识别结果。进一步地,所述预测置信度信息包括位置置信度信息和类别置信度信息;其中,所述位置置信度信息用于反映所述坐标信息的置信程度,所述类别置信度信息用于反映所述预测字符的置信程度。r>进一步地,所述坐标信息包括对应于每个所述预测字符的矩形边界的至少一个顶点坐标,并且每个所述预测字符的所述顶点坐标的类型一致。进一步地,所述坐标信息包括所述矩形边界的两个相对顶点的坐标。进一步地,所述方法还包括:生成所述验证码样本图片,并自动记录所述验证码样本图片中所述各个字符及所述各个字符的所述坐标信息,从而自动生成用于训练所述目标检测网络的训练样本集。进一步地,所述目标检测网络包括yolov3网络。进一步地,所述预设阈值为0.8。第二方面,本专利技术实施例提供一种基于目标检测的验证码识别装置,该装置包括:预测结果输出模块,用于:将接收的验证码图片输入到预先训练好的目标检测网络,所述目标检测网络的输出数据包括与所述验证码图片中的每个字符对应的至少一个预测结果,所述预测结果包括预测字符、所述预测字符的坐标信息及预测置信度信息;其中,所述目标检测网络是以验证码样本图片作为输入,以包含所述验证码样本图片中各个字符及各个字符的坐标信息的输出标签训练得到;验证码识别模块,用于:选取所述预测结果中所述预测置信度信息大于预设阈值的多个预测结果,并将所述多个预测结果中的所述预测字符按照所述坐标信息进行排序,从而得到验证码识别结果。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所提供的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。本专利技术实施例提供的基于目标检测的验证码识别方法及装置,通过将验证码图片输入到目标检测网络,输出包含预测字符、预测字符的坐标信息及预测置信度信息的预测结果,将预测结果按照置信度信息排序,得到验证码识别结果,可以实现对验证码图片中的字符的顺序进行识别,可以区分验证码图片中的相同字符,并且识别过程不受到验证码长度的限制,验证码长度可以任意,由此,大大提高了验证码识别的精度和灵活性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的基于目标检测的验证码识别方法流程图;图2是本专利技术一实施例提供的基于目标检测的验证码识别装置的结构示意图;图3示例了一种电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1是本专利技术一实施例提供的基于目标检测的验证码识别方法流程图。如图1所示,所述方法包括:步骤101、将接收的验证码图片输入到预先训练好的目标检测网络,所述目标检测网络的输出数据包括与所述验证码图片中的每个字符对应的至少一个预测结果,所述预测结果包括预测字符、所述预测字符的坐标信息及置信度信息;其中,所述目标检测网络是以验证码样本图片作为输入,以包含所述验证码样本图片中各个字符及各个字符的坐标信息的输出标签训练得到。基于目标检测的验证码识别装置将接收的验证码图片输入到预先训练好的目标检测网络,目标检测网络可以识别图片中的字符及字符的位置信息,目标检测网络的输出数据包括与验证码图片中的每个字符对应的至少一个预测结果,也即对应于验证码图片中的每个字符,可能输出多个预测结果。预测结果包括预测字符(即对字符的具体内容进行预测),预测字符的坐标信息以及预测置信度信息。所述预测置信度信息用于反映预测结果的置信程度,比如可以用一个分数进行表示。验证码图片及验证码样本图片中的字符可以为字母、数字、文字等。其中,目标检测网络是预先训练好、用于进行验证码识别的网络。目标检测网络在训练时,以验证码样本图片作为输入、以包含验证码样本图片中各个字符及各个字符的坐标信息作为输出标签训练得到。步骤102、选取所述预测结果中所述置信度信息大于预设阈值的多个预测结果,并将所述多个预测结果中的所述预测字符按照所述坐标信息进行排序,从而得到验证码识别结果。置信度信息的数值大小反映预测结果的可信度,值越高表示预测结果越准确。在本专利技术实施例中,可以设定置信度信息的一个预设阈值,认为置信度信息大于这个预设阈值时,预测结果是准确可信的。由于对应于每个字符可能具有多个预测结果,这里通过预设阈值便可以实现在多个预测结果中进行筛选,从而获取到预测更为准确的结果。对于每个字符对应的预测结果均根据预设阈值进行筛选,筛选预测结果中大于预设阈值的预测结果,这样保留下的每个字符的预测结果将是最为准确的。得到各个字符的预测结果中置信度信息大于预设阈值的多个预测结果后,将多个预测结果中的预测字符按照相应的坐标信息进行排序,从而将输入的验证码图片中不同位置的字符的预测字符按照坐标信息进行了排序,从而得到最终的验证码识别结果。本专利技术实施例所提供的验证码识别方法,通过将验证码图片输入到目标检测网络,输出包含预测本文档来自技高网...

【技术保护点】
1.一种基于目标检测的验证码识别方法,其特征在于,包括:/n将接收的验证码图片输入到预先训练好的目标检测网络,所述目标检测网络的输出数据包括与所述验证码图片中的每个字符对应的至少一个预测结果,所述预测结果包括预测字符、所述预测字符的坐标信息及预测置信度信息;其中,所述目标检测网络是以验证码样本图片作为输入,以包含所述验证码样本图片中各个字符及各个字符的坐标信息的输出标签训练得到;/n选取所述预测结果中所述预测置信度信息大于预设阈值的多个预测结果,并将所述多个预测结果中的所述预测字符按照所述坐标信息进行排序,从而得到验证码识别结果。/n

【技术特征摘要】
1.一种基于目标检测的验证码识别方法,其特征在于,包括:
将接收的验证码图片输入到预先训练好的目标检测网络,所述目标检测网络的输出数据包括与所述验证码图片中的每个字符对应的至少一个预测结果,所述预测结果包括预测字符、所述预测字符的坐标信息及预测置信度信息;其中,所述目标检测网络是以验证码样本图片作为输入,以包含所述验证码样本图片中各个字符及各个字符的坐标信息的输出标签训练得到;
选取所述预测结果中所述预测置信度信息大于预设阈值的多个预测结果,并将所述多个预测结果中的所述预测字符按照所述坐标信息进行排序,从而得到验证码识别结果。


2.根据权利要求1所述的基于目标检测的验证码识别方法,其特征在于,所述预测置信度信息包括位置置信度信息和类别置信度信息;其中,所述位置置信度信息用于反映所述坐标信息的置信程度,所述类别置信度信息用于反映所述预测字符的置信程度。


3.根据权利要求1所述的基于目标检测的验证码识别方法,其特征在于,所述坐标信息包括对应于每个所述预测字符的矩形边界的至少一个顶点坐标,并且每个所述预测字符的所述顶点坐标的类型一致。


4.根据权利要求3所述的基于目标检测的验证码识别方法,其特征在于,所述坐标信息包括所述矩形边界的两个相对顶点的坐标。


5.根据权利要求1所述的基于目标检测的验证码识别方法,其特征在于,所述方法还包括:
生成所述验证码样本图片,并自动记录所述验证码样本图片中所述各个字符及所述各...

【专利技术属性】
技术研发人员:方堉欣王子宁李青原陈振煜李爱民刘思德
申请(专利权)人:南方医科大学南方医院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1