一种训练样本生成方法、机读码识别方法及装置制造方法及图纸

技术编号：26343458 阅读：36 留言：0更新日期：2020-11-13 20:45

本申请提供一种训练样本生成方法、机读码识别方法及装置。方法包括：根据护照机读码的命名规则随机生成机读码字符串；根据所述机读码字符串生成包括所述机读码字符串的字符图像；获取护照证件的背景图像，并将所述字符图像与所述背景图像进行融合，获得样本图像；根据所述样本图像和所述机读码字符串获得训练样本。本申请实施例通过根据机读码的命名规则随机生成机读码字符串，并将机读码字符串与护照证件的背景图像进行融合，生成训练样本，不需要使用真实的护照图像，并且能够生成充足的训练样本。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练样本生成方法、机读码识别方法及装置
本申请涉及图像处理
，具体而言，涉及一种训练样本生成方法、机读码识别方法及装置。
技术介绍
随着深度学习的兴起，文本识别的准确率相比以前有了较大幅度的提升，文本识别也逐渐用于实际生活中，比如发票识别、汽车VN码识别、车牌识别、证件识别等领域。证件识别的应用领域又细分为多种证件，包括身份证、行驶证、护照等。其中，护照识别的方法主要是两种，第一种是对于带有芯片的电子护照，可以直接读取芯片识别护照相关信息；第二种是对于不带芯片的非电子护照，利用文本识别算法识别护照的机读码，然后将机读码进行解码获得护照相关信息。其中，文本识别一般是指对文本图像进行识别分析处理，获取文字图像上有用文字信息的过程。主要可分为光学文本识别、自然场景中的文本识别、特殊场景中的文本识别。用于护照机读码识别的文本识别算法涉及深度学习技术，需要大量的护照上的机读码图像数据来进行模型训练，但是因护照本身的隐私性，护照的实际图像数据并不容易获取到，而没有足够的数据用于深度学习文本识别算法的训练，护照机...

【技术保护点】
1.一种训练样本生成方法，其特征在于，包括：/n根据护照机读码的命名规则随机生成机读码字符串；/n根据所述机读码字符串生成包括所述机读码字符串的字符图像；/n获取护照证件的背景图像，并将所述字符图像与所述背景图像进行融合，获得样本图像；/n根据所述样本图像和所述机读码字符串获得训练样本。/n

【技术特征摘要】
1.一种训练样本生成方法，其特征在于，包括：
根据护照机读码的命名规则随机生成机读码字符串；
根据所述机读码字符串生成包括所述机读码字符串的字符图像；
获取护照证件的背景图像，并将所述字符图像与所述背景图像进行融合，获得样本图像；
根据所述样本图像和所述机读码字符串获得训练样本。

2.根据权利要求1所述的方法，其特征在于，所述将所述字符图像与所述背景图像进行融合，包括：
对所述背景图像进行预处理；其中，所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种；
将所述字符图像与预处理后的背景图像进行融合。

3.根据权利要求1所述的方法，其特征在于，在获得样本图像之后，所述方法还包括：
对所述样本图像进行噪声处理，获得加噪后的样本图像；
所述根据所述样本图像和所述机读码字符串获得训练样本，包括：
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。

4.根据权利要求3所述的方法，其特征在于，所述对所述样本图像进行噪声处理，包括：
对所述样本图像进行图像模糊处理，以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。

5.一种机读码识别方法，其特征在于，包括：
获取待识别图像，所述待识别图像包括待识别的机读码；
将所述待识别图像输入到识别模型中，获得所述识别模型输出的机读码；其中，所述识别模型为通过如权利要求1-4任一项所述的方法生成的训练样本进行训练获得。

6.根据权利要求5所述的方法，其特征在于，所述将所述待...

【专利技术属性】
技术研发人员：张发恩，陆强，袁智超，
申请(专利权)人：创新奇智重庆科技有限公司，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人