客票行程单识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29874300 阅读:28 留言:0更新日期:2021-08-31 23:49
本发明专利技术涉及图像处理技术领域,提供了一种客票行程单识别方法、装置、计算机设备和存储介质,所述方法包括:获取待识别客票行程单图像;对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像;根据所述类别调用对应的专项识别网络,利用所述专项识别网络对标注有所述客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。采用本方法能够减少繁琐工作且提高效率。

【技术实现步骤摘要】
客票行程单识别方法、装置、计算机设备和存储介质
本专利技术属于图像处理
,尤其涉及一种客票行程单识别方法、装置、计算机设备和存储介质。
技术介绍
客票行程单是用于购买机票的相关凭证,现有不同企业基于不同的需求,通常需要对客票行程单进行录入归档,比如员工的差旅报销等。然而,传统客票行程单的录入归档工作通常都是由相关工作人员进行手动操作录入,不仅繁琐且效率低下。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够减少繁琐操作且提高效率的客票行程单识别方法、装置、计算机设备和存储介质。本专利技术提供一种客票行程单识别方法,包括:获取待识别客票行程单图像;对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像;根据所述类别调用对应的专项识别网络,利用所述专项识别网络对标注有所述客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。在其中一个实施例中,所述专项识别网络的训练方法,包括:采集第一客票行程单图像集;分别截取所述第一客票行程单图像集中各图像上的各客票关键词条的背景区域进行拼接,得到各所述客票关键词条的背景图像集;根据各所述客票关键词条的字体样式分别收集相应的字体,生成各所述客票关键词条的词条集;分别将各所述词条集中的词条,随机写入到对应的所述背景图像集中的背景图像上,生成各所述客票关键词条的专项数据集;利用各所述专项数据集分别对构建的第一网络结构进行训练,得到各所述客票关键词条对应的专项识别网络。在其中一个实施例中,所述分别将各所述词条集中的词条,随机写入到对应的所述背景图像集中的背景图像上,生成各所述客票关键词条的专项数据集,包括:随机从所述背景图像集中选取一张背景图像,按照预设尺寸对所述背景图像进行截取,得到截取背景;从所述词条集中随机选取词条,并将所述词条随机倾斜写入到所述截取背景上,生成专项数据集。在其中一个实施例中,所述利用各所述专项数据集分别对构建的第一网络结构进行训练,得到各所述客票关键词条对应的专项识别网络,包括:将所述专项数据集划分为专项训练集和专项测试集;利用所述专项训练集训练所述第一网络结构,得到初始专项识别网络;将所述专项测试集中的图像输入至所述初始专项识别网络中进行信息识别,输出所述专项测试集中各图像的信息置信度;将所述信息置信度小于第一阈值的图像的客票关键词条与真实的客票行程单上的客票关键词条进行对比分析,根据分析结果调整专项数据集的构建方式;根据调整后的构建方式重构专项数据集,利用重构的专项数据集迭代训练所述初始专项识别,得到训练好的专项识别网络。在其中一个实施例中,所述对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像,包括:调用预先训练好的目标检测网络;将所述待识别客票行程单图像输入至所述目标检测网络中进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像。在其中一个实施例中,所述目标检测网络的训练方法,包括:构建第二客票行程单图像集,将所述第二客票行程单数据集划分为目标检测训练集和目标检测测试集;对所述目标检测训练集中各图像的客票关键词条的位置和类别标注后,训练构建的第二网络结构,得到初始目标检测网络;将所述目标检测测试集中的各图像输入到所述初始目标检测网络中进行测试,统计所述初始目标检测网络的漏检错检数目;当所述漏检错检数目大于第二阈值时,将所述第二客票行程单图像集中图像的客票关键词条与真实的客票行程单上的客票关键词条进行对比分析,根据分析结果调整第二客票行程单图像集的构建方式;根据调整后的构建方式重构第二客票行程单图像集,利用重构的第二客票行程单图像集迭代训练所述初始目标检测网络,得到训练好的目标检测网络。在其中一个实施例中,所述第一网络结构基于密集卷积连接网络和基于神经网络的时间分类算法构建。一种客票行程单识别装置,包括:获取模块,用于获取待识别客票行程单图像;检测模块,用于对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像;信息识别模块,用于根据所述类别调用对应的专项识别网络,利用所述专项识别网络对标注有所述客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。本专利技术还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储由计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的客票行程单识别方法的步骤。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的客票行程单识别方法的步骤。上述客票行程单识别分类方法、装置、计算机设备和存储介质,通过获取待识别客票行程单图像,对待识别客票行程单图像进行客票关键词条的检测,得到各客票关键词条的类别以及标注有客票关键词条的客票关键词条图像后,进一步根据类别调用对应的专项识别网络,利用专项识别网络对标注有客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。该方法实现了利用人工智能完成客票行程单的检测和信息识别,后续可以直接对所识别的信息进行录入,不仅减少了人工录入的繁琐工作还提高了效率。且对于信息识别采用专项的识别网络进行识别,还能够进一步的提高识别的准确率。附图说明图1为一个实施例中客票行程单识别方法的应用环境图。图2为一个实施例中客票行程单识别方法的流程示意图。图3为一个实施例中客票关键词条图像示意图。图4为一个实施例中客票关键词条信息示意图。图5为一个实施例中专项识别网络的训练方法的流程示意图。图6为一个实施例中客票关键词条标注数据示意图。图7为一个实施例中客票行程单识别的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本申请提供的客票行程单识别方法,可以应用于如图1所示的应用环境中,该应用环境涉及终端102和服务器104。其中,终端102通过网络与服务器104进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和携带式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当终端102接收到待识别客票行程单图像时,可以由终端102单独实现上述客票行程单识别方法。也可以由终端102将待识别客票行程单图像发送给通信的服务器104,由服务器104实现上述客票行程单识别方法。以服务器104为例本文档来自技高网...

【技术保护点】
1.一种客票行程单识别方法,其特征在于,包括:/n获取待识别客票行程单图像;/n对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像;/n根据所述类别调用对应的专项识别网络,利用所述专项识别网络对标注有所述客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。/n

【技术特征摘要】
1.一种客票行程单识别方法,其特征在于,包括:
获取待识别客票行程单图像;
对所述待识别客票行程单图像进行客票关键词条的检测,得到各所述客票关键词条的类别以及标注有所述客票关键词条的客票关键词条图像;
根据所述类别调用对应的专项识别网络,利用所述专项识别网络对标注有所述客票关键词条的客票关键词条图像进行信息识别,得到客票关键词条信息。


2.根据权利要求1所述的方法,其特征在于,所述专项识别网络的训练方法,包括:
采集第一客票行程单图像集;
分别截取所述第一客票行程单图像集中各图像上的各客票关键词条的背景区域进行拼接,得到各所述客票关键词条的背景图像集;
根据各所述客票关键词条的字体样式分别收集相应的字体,生成各所述客票关键词条的词条集;
分别将各所述词条集中的词条,随机写入到对应的所述背景图像集中的背景图像上,生成各所述客票关键词条的专项数据集;
利用各所述专项数据集分别对构建的第一网络结构进行训练,得到各所述客票关键词条对应的专项识别网络。


3.根据权利要求2所述的方法,其特征在于,所述分别将各所述词条集中的词条,随机写入到对应的所述背景图像集中的背景图像上,生成各所述客票关键词条的专项数据集,包括:
随机从所述背景图像集中选取一张背景图像,按照预设尺寸对所述背景图像进行截取,得到截取背景;
从所述词条集中随机选取词条,并将所述词条随机倾斜写入到所述截取背景上,生成专项数据集。


4.根据权利要求2所述的方法,其特征在于,所述利用各所述专项数据集分别对构建的第一网络结构进行训练,得到各所述客票关键词条对应的专项识别网络,包括:
将所述专项数据集划分为专项训练集和专项测试集;
利用所述专项训练集训练所述第一网络结构,得到初始专项识别网络;
将所述专项测试集中的图像输入至所述初始专项识别网络中进行信息识别,输出所述专项测试集中各图像的信息置信度;
将所述信息置信度小于第一阈值的图像的客票关键词条与真实的客票行程单上的客票关键词条进行对比分析,根据分析结果调整专项数据集的构建方式;
根据调整后的构建方式重构专项数据集,利用重构的专项数据集迭代训练所述初始专项识别,得到训练好的专项识别网络。


5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:郭建京周忠诚张圣栋黄九鸣杜海燕
申请(专利权)人:湖南星汉数智科技有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1