System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 识别模型训练方法以及图片验证码识别方法技术_技高网

识别模型训练方法以及图片验证码识别方法技术

技术编号:40418246 阅读:7 留言:0更新日期:2024-02-20 22:36
本申请实施例公开了一种识别模型训练方法以及图片验证码识别方法,其中,识别模型训练方法包括:将图片验证码输入至初始识别模型;通过字符检测模块提取图片验证码中的各字符对应的第一字符图片;通过数据增广模块调整各第一字符图片的特征,得到第二字符图片;通过字符识别模块对各第二字符图片进行分组,得到至少一个词组;通过词组排序模块对各词组进行排序,得到图片验证码对应的验证码;将验证码与图片验证码的标识验证码进行比较,得到比较结果,并根据比较结果对初始识别模型的参数进行调整,得到训练完成的识别模型。采用本申请实施例,可以提高识别模型的泛化能力。

【技术实现步骤摘要】

本申请涉及图片识别领域,具体涉及一种识别模型训练方法以及图片验证码识别方法


技术介绍

1、随着互联网的快速发展,网站验证机制中验证码技术的应用越来越广泛。验证码是一种区分用户是计算机还是人的公共全自动程序。其中,基于文本的验证码由于容易被识别而逐步淡出历史舞台,取而代之的是图像验证码。图像验证码通常包含字母、数字和图形,并添加杂点、噪声、变形等,使其难以被破解。

2、图片验证码作为一种图形验证码,其安全性相对较高,因而被广泛使用。目前,图片验证码的识别方法主要基于模板匹配。而基于模板匹配的方法需要收集大量图片作为模板样本,但收集模板样本十分耗时,导致该方法的泛化能力较差。


技术实现思路

1、本申请提供了一种识别模型训练方法以及图片验证码识别方法,可以提高识别模型的泛化能力。

2、在本申请的第一方面,本申请提供了一种识别模型训练方法,包括:

3、将图片验证码输入至初始识别模型,所述初始识别模型包括字符检测模块、数据增广模块、字符识别模块以及词组排序模块;

4、通过所述字符检测模块提取所述图片验证码中的各字符对应的第一字符图片;

5、通过所述数据增广模块调整各所述第一字符图片的特征,得到第二字符图片;

6、通过所述字符识别模块对各所述第二字符图片进行分组,得到至少一个词组;

7、通过所述词组排序模块对各所述词组进行排序,得到所述图片验证码对应的验证码;

8、将所述验证码与所述图片验证码的标识验证码进行比较,得到比较结果,并根据所述比较结果对所述初始识别模型的参数进行调整,得到训练完成的识别模型。

9、通过采用上述技术方案,构建一个包含字符检测模块、数据增广模块、字符识别模块和词组排序模块的初始识别模型,通过调整模型参数进行多轮训练,不断优化模型,最终得到一个对复杂变形验证码具有较强适应能力和泛化能力的识别模型。在应用阶段,该识别模型可以直接对输入的图片验证码进行端到端识别,无需人工收集大量样本模板,避免了模板样本收集的复杂工作,降低了应用难度。且识别模型对验证码的字体、变形、背景等变化具有很强的适应性,当验证码样式改变时,该模型可以快速适应新样式的验证码,无需重新收集模板样本进行更新,大大提高了识别效率。

10、可选的,所述通过所述字符检测模块提取所述图片验证码中的各字符对应的第一字符图片,包括:

11、通过所述字符检测模块识别所述图片验证码中的各字符,并根据各所述字符在所述图片验证码中的位置,对所述图片验证码进行裁剪,得到各所述第一字符图片。

12、通过采用上述技术方案,先用字符检测模块识别每个字符在验证码图片中的位置坐标,再进行裁剪,相比直接裁剪字符图片,可以更精确地定位每个字符的区域,确保裁剪得到的第一字符图片包含完整的字符信息。由于定位到了每个字符在原图中的具体坐标,这样裁剪出来的第一字符图片保留了验证码图片中该字符的所有视觉特征信息,包括字形、颜色、背景等,为后续识别模块准确获取字符类别信息奠定了基础。该裁剪方式过滤掉了图像中非字符的背景区域,也减少了识别模块的输入规模,降低了识别难度。通过先识别坐标再裁剪的流程,使输出的第一字符图片质量更高,包含完整单字符信息,有利于提高后续识别模块的效果。

13、可选的,所述通过所述数据增广模块调整各所述第一字符图片的特征,得到第二字符图片,包括:

14、通过所述数据增广模块对各所述第一字符图片进行仿射变换、透视变换以及随机颜色变换,得到与各所述第一字符图片特征不同的所述第二字符图片。

15、通过采用上述技术方案,仿射变换可以改变字符形状,增加各种变形的字符样本,提高模型对字符形状变化的适应力。透视变换可以增加不同视角、缩放的字符样本,提高模型对视角变化的适应力。随机颜色变换可以得到颜色特征不同的字符样本,提高模型对颜色变化的适应力。这三种图像增广技术都能扩展字符样本的视觉特征,不改变字符类别属性,生成了更多特征各异的第二字符图片。数据增广模块生成的第二字符图片覆盖了验证码字符可能出现的各种形状、视角、颜色的变化情况,提高了模型对验证码多样性的适应力。大量增加了字符样本的数量和多样性,缓解了样本不均衡问题,增强了模型的泛化能力。为识别模块提供了更丰富和全面的训练数据,提高了模型的识别准确率。

16、可选的,所述通过所述字符识别模块对各所述第二字符图片进行分组,得到至少一个词组,包括:

17、通过所述字符识别模块确定所述各所述第二字符图片位于所述图片验证码的坐标,所述坐标为各所述第二字符图片的边界框的中心点,根据各所述坐标,对各所述第二字符图片进行分组,得到至少一个所述词组。

18、通过采用上述技术方案,字符识别模块先确定每个第二字符图片在验证码中的坐标,即字符边界框中心点的坐标。根据坐标位置,可以更准确地判断字符之间的逻辑关系,将位置相邻、语义相关的字符划分到同一个词组。相比直接根据顺序分组,该方法充分利用了字符的空间信息,提高了分组的精确性,避免了可能的错误分组。分组结果更加准确可靠,确保后续词组排序的输入质量,从而提高整体验证码识别效果。该方法为词组排序提供了语义和位置双重信息,增强了排序模块的理解能力。

19、可选的,所述坐标包括横坐标和纵坐标,所述根据各所述坐标,对各所述第二字符图片进行分组,得到至少一个所述词组,包括:

20、若存在至少两个所述第二字符图片左右相邻,则计算两个左右相邻的第二字符图片的横坐标之差,将所述横坐标之差小于或等于第一阈值的第二字符图片确定为一个词组;

21、若存在至少两个所述第二字符图片上下相邻,则计算两个上下相邻的第二字符图片的纵坐标之差,将所述纵坐标之差小于或等于第二阈值的第二字符图片确定为一个词组。

22、通过采用上述技术方案,根据两个字符中心坐标的横坐标差值,可以判断它们是否左右相邻,如果差值小于第一阈值,则确定它们在水平方向上相邻,属于一个词组。根据两个字符中心坐标的纵坐标差值,可以判断它们是否上下相邻,如果差值小于第二阈值,则确定它们在垂直方向上相邻,属于一个词组。利用了验证码图像中字符的空间分布规律,根据坐标关系判断字符的相邻程度,进行词组划分。该技术手段将相邻程度高的字符合理地划分到了同一词组中,提高了分组的精确度。相比直接顺序分组,充分利用了图像平面坐标的信息,使得分组结果更加准确可靠。

23、可选的,所述通过所述词组排序模块对各所述词组进行排序,得到所述图片验证码对应的验证码,包括:

24、通过所述词组排序模块确定各所述词组的文本序列,根据所述文本序列确定各所述词组的序号,根据所述词组的序号输出各词组对应的字符,得到所述验证码。

25、通过采用上述技术方案,词组排序模块先解析出每个词组对应的文本序列。再根据语义流畅度判断词组的最终位置序号。根据为每个词组确定的序号,顺序输出每个词组包含的字符串。相比直接输出排序词组,本文档来自技高网...

【技术保护点】

1.一种识别模型训练方法,其特征在于,包括:

2.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述字符检测模块提取所述图片验证码中的各字符对应的第一字符图片,包括:

3.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述数据增广模块调整各所述第一字符图片的特征,得到第二字符图片,包括:

4.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述字符识别模块对各所述第二字符图片进行分组,得到至少一个词组,包括:

5.根据权利要求4所述的识别模型训练方法,其特征在于,所述坐标包括横坐标和纵坐标,所述根据各所述坐标,对各所述第二字符图片进行分组,得到至少一个所述词组,包括:

6.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述词组排序模块对各所述词组进行排序,得到所述图片验证码对应的验证码,包括:

7.一种图片验证码识别方法,其特征在于,包括:

8.一种识别模型训练系统,其特征在于,所述系统包括:

9.一种电子设备,其特征在于,包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1-6或7中任意一项所述的方法。

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有指令,当所述指令被执行时,执行如权利要求1-6或7任意一项所述的方法。

...

【技术特征摘要】

1.一种识别模型训练方法,其特征在于,包括:

2.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述字符检测模块提取所述图片验证码中的各字符对应的第一字符图片,包括:

3.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述数据增广模块调整各所述第一字符图片的特征,得到第二字符图片,包括:

4.根据权利要求1所述的识别模型训练方法,其特征在于,所述通过所述字符识别模块对各所述第二字符图片进行分组,得到至少一个词组,包括:

5.根据权利要求4所述的识别模型训练方法,其特征在于,所述坐标包括横坐标和纵坐标,所述根据各所述坐标,对各所述第二字符图片进行分组,得到至少一个所述词组,包括:

【专利技术属性】
技术研发人员:陈硕毛秀萍关济雨王友金
申请(专利权)人:苏州创旅天下信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1