【技术实现步骤摘要】
验证码的识别方法及装置、电子设备、存储介质
[0001]本申请涉及图像处理
,特别涉及一种验证码的识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
[0002]验证码,作为一种用户登录验证技术,在互联网服务的多个场景中被广泛应用。一般,验证码面向的使用者是用户,但在一些场景中,需要借助机器自主识别验证码。示例性的,企业在对自身应用服务进行功能测试、爬取数据时,需自动化识别应用服务各个业务流程中出现的验证码。随着验证码技术的演进,目前验证码的形式已不仅仅局限于识别验证码图像中的文字,还对待识别的文字有了限定条件(比如:字符颜色、字符大小等)。然而,现有技术一般只能识别验证码中的所有字符,因此,亟需一种自动化识别满足限定条件的字符的方案。
技术实现思路
[0003]本申请实施例的目的在于提供一种验证码的识别方法及装置、电子设备、计算机可读存储介质,用于自动化识别满足限定条件的字符。
[0004]一方面,本申请提供了一种验证码的识别方法,包括:
[0005]对验证码指示信息进行语义识别 ...
【技术保护点】
【技术特征摘要】
1.一种验证码的识别方法,其特征在于,包括:对验证码指示信息进行语义识别,确定指定字符类型;将验证码图像输入已训练的多任务序列识别模型,获得多个序列识别结果;根据所述多个序列识别结果,确定与所述指定字符类型匹配的至少一个目标字符;基于至少一个目标字符,构建所述验证码图像的验证码识别结果。2.根据权利要求1所述的方法,其特征在于,所述对验证码指示信息进行语义识别,确定指定字符类型,包括:对所述验证码指示信息进行分词处理,获得若干分词结果;对所述若干分词结果进行命名实体识别,获得若干作为实体的分词结果;从所述若干作为实体的分词结果中,筛选出至少一种实体,作为所述指定字符类型。3.根据权利要求1所述的方法,其特征在于,所述指定字符类型指示指定尺寸、指定颜色和指定类别中的一个或多个的组合,所述多个序列识别结果包括字符内容序列、字符颜色序列、字符尺寸序列;在所述根据所述多个序列识别结果,确定与所述指定字符类型匹配的至少一个目标字符之前,所述方法还包括:如果所述指定字符类型包括指定尺寸,从所述字符尺寸序列中获取所述字符内容序列中每个字符对应的尺寸信息;其中,所述字符内容序列包括所述验证码图像中的多个字符,所述字符尺寸序列包括字符内容序列中每个字符对应的尺寸信息;如果所述指定字符类型包括指定颜色,从所述字符颜色序列中获取所述字符内容序列中每个字符对应的颜色信息;其中,所述字符颜色序列包括字符内容序列中每个字符对应的颜色信息;如果所述指定字符类型包括指定类别,确定所述字符内容序列中每个字符对应的类别信息。4.根据权利要求1所述的方法,其特征在于,所述多任务序列识别模型通过如下方式训练得到:将样本数据集中的样本验证码图像,作为多任务序列识别算法的输入;其中,所述样本验证码图像包括字符内容序列标签、字符尺寸序列标签、字符颜色序列标签;通过所述多任务序列识别算法,输出所述样本验证码图像对应的预测字符内容序列、预测字符尺寸序列、预测字符颜色序列;根据所述字符内容序列标签...
【专利技术属性】
技术研发人员:宋祺,程文渊,张睿,
申请(专利权)人:上海弘玑信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。