一种训练样本生成方法、机读码识别方法及装置制造方法及图纸

技术编号:26343458 阅读:36 留言:0更新日期:2020-11-13 20:45
本申请提供一种训练样本生成方法、机读码识别方法及装置。方法包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。本申请实施例通过根据机读码的命名规则随机生成机读码字符串,并将机读码字符串与护照证件的背景图像进行融合,生成训练样本,不需要使用真实的护照图像,并且能够生成充足的训练样本。

【技术实现步骤摘要】
一种训练样本生成方法、机读码识别方法及装置
本申请涉及图像处理
,具体而言,涉及一种训练样本生成方法、机读码识别方法及装置。
技术介绍
随着深度学习的兴起,文本识别的准确率相比以前有了较大幅度的提升,文本识别也逐渐用于实际生活中,比如发票识别、汽车VN码识别、车牌识别、证件识别等领域。证件识别的应用领域又细分为多种证件,包括身份证、行驶证、护照等。其中,护照识别的方法主要是两种,第一种是对于带有芯片的电子护照,可以直接读取芯片识别护照相关信息;第二种是对于不带芯片的非电子护照,利用文本识别算法识别护照的机读码,然后将机读码进行解码获得护照相关信息。其中,文本识别一般是指对文本图像进行识别分析处理,获取文字图像上有用文字信息的过程。主要可分为光学文本识别、自然场景中的文本识别、特殊场景中的文本识别。用于护照机读码识别的文本识别算法涉及深度学习技术,需要大量的护照上的机读码图像数据来进行模型训练,但是因护照本身的隐私性,护照的实际图像数据并不容易获取到,而没有足够的数据用于深度学习文本识别算法的训练,护照机读码识别的准确率就得本文档来自技高网...

【技术保护点】
1.一种训练样本生成方法,其特征在于,包括:/n根据护照机读码的命名规则随机生成机读码字符串;/n根据所述机读码字符串生成包括所述机读码字符串的字符图像;/n获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;/n根据所述样本图像和所述机读码字符串获得训练样本。/n

【技术特征摘要】
1.一种训练样本生成方法,其特征在于,包括:
根据护照机读码的命名规则随机生成机读码字符串;
根据所述机读码字符串生成包括所述机读码字符串的字符图像;
获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;
根据所述样本图像和所述机读码字符串获得训练样本。


2.根据权利要求1所述的方法,其特征在于,所述将所述字符图像与所述背景图像进行融合,包括:
对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;
将所述字符图像与预处理后的背景图像进行融合。


3.根据权利要求1所述的方法,其特征在于,在获得样本图像之后,所述方法还包括:
对所述样本图像进行噪声处理,获得加噪后的样本图像;
所述根据所述样本图像和所述机读码字符串获得训练样本,包括:
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。


4.根据权利要求3所述的方法,其特征在于,所述对所述样本图像进行噪声处理,包括:
对所述样本图像进行图像模糊处理,以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。


5.一种机读码识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括待识别的机读码;
将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过如权利要求1-4任一项所述的方法生成的训练样本进行训练获得。


6.根据权利要求5所述的方法,其特征在于,所述将所述待...

【专利技术属性】
技术研发人员:张发恩陆强袁智超
申请(专利权)人:创新奇智重庆科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1