【技术实现步骤摘要】
一种训练样本生成方法、机读码识别方法及装置
本申请涉及图像处理
,具体而言,涉及一种训练样本生成方法、机读码识别方法及装置。
技术介绍
随着深度学习的兴起,文本识别的准确率相比以前有了较大幅度的提升,文本识别也逐渐用于实际生活中,比如发票识别、汽车VN码识别、车牌识别、证件识别等领域。证件识别的应用领域又细分为多种证件,包括身份证、行驶证、护照等。其中,护照识别的方法主要是两种,第一种是对于带有芯片的电子护照,可以直接读取芯片识别护照相关信息;第二种是对于不带芯片的非电子护照,利用文本识别算法识别护照的机读码,然后将机读码进行解码获得护照相关信息。其中,文本识别一般是指对文本图像进行识别分析处理,获取文字图像上有用文字信息的过程。主要可分为光学文本识别、自然场景中的文本识别、特殊场景中的文本识别。用于护照机读码识别的文本识别算法涉及深度学习技术,需要大量的护照上的机读码图像数据来进行模型训练,但是因护照本身的隐私性,护照的实际图像数据并不容易获取到,而没有足够的数据用于深度学习文本识别算法的训练,护照机 ...
【技术保护点】
1.一种训练样本生成方法,其特征在于,包括:/n根据护照机读码的命名规则随机生成机读码字符串;/n根据所述机读码字符串生成包括所述机读码字符串的字符图像;/n获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;/n根据所述样本图像和所述机读码字符串获得训练样本。/n
【技术特征摘要】
1.一种训练样本生成方法,其特征在于,包括:
根据护照机读码的命名规则随机生成机读码字符串;
根据所述机读码字符串生成包括所述机读码字符串的字符图像;
获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;
根据所述样本图像和所述机读码字符串获得训练样本。
2.根据权利要求1所述的方法,其特征在于,所述将所述字符图像与所述背景图像进行融合,包括:
对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;
将所述字符图像与预处理后的背景图像进行融合。
3.根据权利要求1所述的方法,其特征在于,在获得样本图像之后,所述方法还包括:
对所述样本图像进行噪声处理,获得加噪后的样本图像;
所述根据所述样本图像和所述机读码字符串获得训练样本,包括:
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。
4.根据权利要求3所述的方法,其特征在于,所述对所述样本图像进行噪声处理,包括:
对所述样本图像进行图像模糊处理,以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。
5.一种机读码识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括待识别的机读码;
将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过如权利要求1-4任一项所述的方法生成的训练样本进行训练获得。
6.根据权利要求5所述的方法,其特征在于,所述将所述待...
【专利技术属性】
技术研发人员:张发恩,陆强,袁智超,
申请(专利权)人:创新奇智重庆科技有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。