一种票据识别、识别模型训练方法、装置及设备制造方法及图纸

技术编号:38103143 阅读:12 留言:0更新日期:2023-07-06 09:22
本申请提供一种票据识别、识别模型训练方法、装置及设备,涉及计算机技术领域,用于提高票据识别的准确性。该票据识别方法,包括:获取包括目标票据的目标图像;将目标图像输入训练后的识别模型,获得目标票据中的第一票据信息;若第一票据信息与预存的第二票据信息匹配,确定目标票据验证通过;其中,训练后的识别模型是基于第一类样本图像对预训练的识别模型进行训练得到的,预训练的识别模型是基于第二类样本图像对未训练的识别模型进行训练得到的,第一类样本图像均包括票据,第二类样本图像包括第一类对象,第一类对象与票据不同。第一类对象与票据不同。第一类对象与票据不同。

【技术实现步骤摘要】
一种票据识别、识别模型训练方法、装置及设备


[0001]本申请涉及计算机
,尤其涉及一种票据识别、识别模型训练方法、装置及设备。

技术介绍

[0002]客运站、火车站等车站的人流量较大,使得工作人员对进站旅客进行检票操作时,工作量较大,且需要一一核对票据中的信息,效率也较低。
[0003]因此,目前通常采用检票闸机进行检票,以提高检票效率。检票闸机中运行有识别模型,识别模型用于识别票据以实现检票的目的。但目前的识别模型均是基于大量的样本图像对初始模型进行训练得到的,由于训练的样本图像的数量较多,需要耗费大量的计算资源。而在样本图像的数量较少的情况下,训练得到的识别模型的识别精度较低,使得识别模型识别票据的准确性较低。

技术实现思路

[0004]本申请提供一种票据识别、识别模型训练方法、装置及设备,用于提高票据识别的准确性。
[0005]第一方面,本申请实施例提供一种票据识别方法,包括:获取包括目标票据的目标图像;将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息;若所述第一票据信息与预存的第二票据信息匹配,确定所述目标票据验证通过;其中,所述训练后的识别模型是基于第一类样本图像对预训练的识别模型进行训练得到的,所述预训练的识别模型是基于第二类样本图像对未训练的识别模型进行训练得到的,所述第一类样本图像均包括票据,所述第二类样本图像包括第一类对象,所述第一类对象与所述票据不同。
[0006]在本申请实施例中,训练后的识别模型基于第一类样本图像对预训练的识别模型进行训练得到的,而预训练的识别模型是已经经过第二类样本图像进行训练后的识别模型,因此,在对训练得到训练后的识别模型的过程中,无需采用大量的样本图像进行训练,即在第一类样本图像的数量较少的情况下,仍可对预训练的识别模型进行训练,从而得到训练后的识别模型。通过这种方式训练得到的训练后的识别模型,不仅可以解决在第一类样本图像的数量较少的情况下,识别票据的准确性较低的问题,还可减少消耗的计算资源。
[0007]在一种可能的实施方式中,所述训练后的识别模型包括训练后的第一子模型和训练后的第二子模型;将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息,包括:将所述目标图像输入所述训练后的第一子模型,获得目标图像的目标字符特征;将所述目标字符特征输入所述训练后的第二子模型,获得所述第一票据信息。
[0008]在该实施方式中,训练后的识别模型识别目标票据是通过训练后的第一子模型和训练后的第二子模型实现的,训练后的第一子模型用于输出目标图像的目标字符特征,训练后的第二子模型用于输出第一票据信息,换言之,训练后的识别模型中的子模型是基于各自所在的领域对目标图像进行分工识别的,使得各子模型识别得到的信息更为准确,有
利于提高训练后的识别模型识别票据的准确性。
[0009]在一种可能的实施方式中,将所述目标字符特征输入所述训练后的第二子模型,获得所述第一票据信息,包括:通过所述训练后的第二子模型中多种长度的标注框,分别对所述目标字符特征中的多种类型的字符进行标注;对标注后的所述多种类型中的每种类型的字符进行识别,获得所述第一票据信息。
[0010]在该实施方式中,训练后的第二子模型中包括多个长度的标注框,使得训练后的第二子模型可对目标字符特征中的多种类型中的每种类型的字符采用合适长度的标注框进行标注,提高了训练后的第二子模型识别目标字符特征的准确性,从而提高了训练后的识别模型识别票据的准确性。
[0011]在一种可能的实施方式中,在将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息之前,所述方法还包括:若所述目标图像的位姿不符合所述预设位姿,则通过预设算法将所述目标图像的位姿转换为预设位姿;识别所述目标图像中的具有边缘特征的区域,以及具有字符特征的区域。
[0012]在该实施方式中,在将目标图像输入训练后的识别模型之前,还需确定目标图像的位姿是否预设位姿,避免目标图像的位姿与预设位姿差别较大,训练后的识别模型无法准确地识别目标图像。
[0013]在一种可能的实施方式中,所述预训练的识别模型包括预训练的第一子模型和预训练的第二子模型,所述预训练的第一子模型包括依次连接的第一特征提取层和第二特征提取层;所述方法还包括:将所述第一类样本图像依次输入所述第一特征提取层,获得样本边缘特征;将所述样本边缘特征输入所述第二特征提取层,获得样本字符特征;确定所述样本字符特征与第一参考特征之间的第一误差;朝降低所述第一误差的方向,调整所述第二特征提取层的参数,保持所述第一特征提取层的参数不变,直至满足第一训练条件,获得所述训练后的第一子模型。
[0014]在该实施方式中,在对预训练的第一子模型进行训练时,由于第一特征提取层提取的是第一类样本图像的样本边缘特征,还未提取到识别票据所需的样本字符特征,因此,不对第一特征提取层的参数进行调整,仅调整第二特征提取层的参数,可简化训练过程,也可减少计算资源的消耗。
[0015]在一种可能的实施方式中,所述方法还包括:将所述样本字符特征输入所述预训练的第二子模型,获得第一样本序列特征;确定所述第一样本序列特征与第二参考特征之间的第二误差;朝降低所述第二误差的方向,调整所述预训练的第二子模型的参数,直至满足第二训练条件,获得训练后的第二子模型。
[0016]在该实施方式中,将预训练的第一子模型输出的样本字符特征输入预训练的第二子模型进行训练,可使得训练后的第二子模型熟悉训练后的第一子模型所输出的样本字符特征,提高了训练后的第二子模型与训练后的第一子模型的适配度,从而提高了训练后的识别模型识别票据的准确性。
[0017]第二方面,本申请实施例提供一种识别模型训练方法,预训练的识别模型包括预训练的第一子模型和预训练的第二子模型,所述预训练的第一子模型包括依次连接的第一特征提取层和第二特征提取层,所述方法包括:将第一类样本图像依次输入所述第一特征提取层,获得样本边缘特征;将所述样本边缘特征输入所述第二特征提取层,获得样本字符
特征;确定所述样本字符特征与第一参考特征之间的第一误差;朝降低所述第一误差的方向,调整所述第二特征提取层的参数,保持所述第一特征提取层的参数不变,直至满足第一训练条件,获得所述训练后的第一子模型。
[0018]在一种可能的实施方式中,所述方法还包括:将所述样本字符特征输入所述预训练的第二子模型,获得第一样本序列特征;确定所述第一样本序列特征与第二参考特征之间的第二误差;朝降低所述第二误差的方向,调整所述预训练的第二子模型的参数,直至满足第二训练条件,获得训练后的第二子模型。
[0019]第三方面,本申请实施例提供一种票据识别装置,包括:收发模块,用于获取包括目标票据的目标图像;处理模块,用于将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息,以及若所述第一票据信息与预存的第二票据信息匹配,确定所述目标票据验证通过;其中,所述训练后的识别模型是基于第一类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据识别方法,其特征在于,包括:获取包括目标票据的目标图像;将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息;若所述第一票据信息与预存的第二票据信息匹配,确定所述目标票据验证通过;其中,所述训练后的识别模型是基于第一类样本图像对预训练的识别模型进行训练得到的,所述预训练的识别模型是基于第二类样本图像对未训练的识别模型进行训练得到的,所述第一类样本图像均包括票据,所述第二类样本图像包括第一类对象,所述第一类对象与所述票据不同。2.根据权利要求1所述的方法,其特征在于,所述训练后的识别模型包括训练后的第一子模型和训练后的第二子模型;将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息,包括:将所述目标图像输入所述训练后的第一子模型,获得目标图像的目标字符特征;将所述目标字符特征输入所述训练后的第二子模型,获得所述第一票据信息。3.根据权利要求2所述的方法,其特征在于,将所述目标字符特征输入所述训练后的第二子模型,获得所述第一票据信息,包括:通过所述训练后的第二子模型中多种长度的标注框,分别对所述目标字符特征中的多种类型的字符进行标注;对标注后的所述多种类型中的每种类型的字符进行识别,获得所述第一票据信息。4.根据权利要求1所述的方法,其特征在于,在将所述目标图像输入训练后的识别模型,获得所述目标票据中的第一票据信息之前,所述方法还包括:若所述目标图像的位姿不符合所述预设位姿,则通过预设算法将所述目标图像的位姿转换为预设位姿;识别所述目标图像中的具有边缘特征的区域,以及具有字符特征的区域。5.根据权利要求2或3所述的方法,其特征在于,所述预训练的识别模型包括预训练的第一子模型和预训练的第二子模型,所述预训练的第一子模型包括依次连接的第一特征提取层和第二特征提取层;所述方法还包括:将所述第一类样本图像依次输入所述第一特征提取层,获得样本边缘特征;将所述样本边缘特征输入所述第二特征提取层,获得样本字符特征;确定所述样本字符特征与第一参考特征之间的第一误差;朝降低所述第一误差的方向,调整所述第二特征提取层的参数,保持所述第一特征提取层的参数不变,直至满足第一训练条件,获得所述训练后的第一子模型。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将所述样本字符特征输入所述预训练的第二子模型,获得第一样本序列特征;确定所述第一样本序列特征与第二参考特征之间的第二误差;朝降低所述第二误差的方向,调整所述预训练的第二子模型的参数,直至满足第二训练条件,获得训练后的第二子模型。7.一种识别模型训练方法,其特征在于,预训练的识别模型包括预训练的...

【专利技术属性】
技术研发人员:李行鲁壮李沈郢饶天宇刘杨王维敏
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1