【技术实现步骤摘要】
纳税号识别方法、装置、存储介质及计算机设备
[0001]本专利技术涉及目标检测
,尤其涉及一种纳税号识别方法、装置、存储介质及计算机设备。
技术介绍
[0002]发票处理是财务管理过程中一项非常重要的工作,工作人员需要对大量的原始票据进行采集和信息录入,以获取每张发票中的票号序列、公司名称、开票日期、金额和税额等信息,并根据获取到的信息进行下一步的验证工作。例如,工作人员需要对每一张发票中公章位置处的纳税号进行验证,确认其是否与纳税公司的纳税号一致,以防止盖错公章。
[0003]由此可见,针对发票中公章内的纳税号进行识别及验证主要还是通过传统的人工识别的方式进行,该过程需要耗费大量的时间,识别效率较低,人力成本较高,且在对大量的票据进行人工检测与识别时、容易出错,识别精度较低。
技术实现思路
[0004]本专利技术的目的旨在至少能解决上述的技术缺陷之一,特别是针对纳税号的识别及验证主要还是通过传统的人工识别的方式进行,该过程不仅耗费大量的时间,识别效率较低,人力成本较高,还存在识别精度较低的技术 ...
【技术保护点】
【技术特征摘要】
1.一种纳税号识别方法,其特征在于,所述方法包括:获取包含公章和位于所述公章内的纳税号的图像数据;确定目标位置识别模型;将所述图像数据输入所述目标位置识别模型中,得到所述目标位置识别模型输出的所述公章在所述图像数据中的公章目标位置框,以及所述纳税号在所述图像数据中的纳税号目标位置框;当确定所述纳税号目标位置框位于所述公章目标位置框的内部时,对所述纳税号目标位置框中的纳税号进行文字识别。2.根据权利要求1所述的纳税号识别方法,其特征在于,所述确定目标位置识别模型,包括:获取包含公章和位于所述公章内的纳税号的样本图像数据,所述样本图像数据包括对所述公章和所述纳税号分别标注的公章真实位置框和纳税号真实位置框;将所述样本图像数据输入预设的初始位置识别模型,得到所述初始位置识别模型对所述样本图像数据输出的多个预测位置框以及每个所述预测位置框的预测标签,所述多个预测位置框包括公章预测位置框以及纳税号预测位置框;以所述公章预测位置框以及所述纳税号预测位置框分别趋近于所述公章真实位置框和所述纳税号真实位置框为目标,训练所述初始位置识别模型;当所述初始位置识别模型满足预设的训练条件时,将训练完成的初始位置识别模型作为目标位置识别模型。3.根据权利要求2所述的纳税号识别方法,其特征在于,所述初始位置识别模型包括数据增强输入层、骨干网络、路径聚合网络、通用检测层;所述将所述样本图像数据输入预设的初始位置识别模型,得到所述初始位置识别模型对所述样本图像数据输出的多个预测位置框以及每个所述预测位置框的预测标签,包括:将所述样本图像数据输入所述数据增强输入层中,对所述样本图像数据中的公章和纳税号所对应的图像区域进行像素增强,输出得到增强图像数据;通过所述骨干网络对所述增强图像数据执行切片操作和卷积操作,提取所述公章和所述纳税号在所述增强图像数据中的结构特征,输出得到由所述结构特征构成的特征图;利用所述路径聚合网络将所述初始位置识别模型在前向传播过程中产生的多个所述特征图进行特征融合,得到融合特征图;将所述融合特征图输入所述通用检测层中,输出得到多个预测位置框以及每个所述预测位置框的预测标签。4.根据权利要求2所述的纳税号识别方法,其特征在于,所述预测标签包括预测位置框的置信度;所述确定目标位置识别模型,还包括:对多个预测位置框按照类别进行分类,所述类别包括公章类别以及纳税号类别;获取所述公章类别中每个预测位置框的置信度,选取所述置信度最大的预测位置框作为公章预测位置框;获取所述纳税号类别中每个预测位置框的置信度,选取所述置信度最大的预测位置框作为纳税号预测位置框。5.根据权利要求2所述的纳税号识别方法,其特征在于,所述预测标签包括预测位置框
【专利技术属性】
技术研发人员:杨德升,
申请(专利权)人:创优数字科技广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。