【技术实现步骤摘要】
票据信息采集方法、装置、计算机设备和存储介质
本申请涉及数据采集
,特别是涉及一种票据信息采集方法、装置、计算机设备和存储介质。
技术介绍
传统的票据信息采集工作多由人工录入完成,存在大量重复手工操作,工作时间冗长且错误率较高。随着图像采集和文字识别技术的发展,也出现了利用文字识别技术采集票据信息的方案。然而,现有技术中的票面识别大多是全票面整体识别,识别成功率和准确率均无法得到很好的保证,识别结果与票据数据库中的具体明细数据存在差异。另外,现有技术中的票面识别大多仅针对具有标准格式的票据,应用场景十分有限。
技术实现思路
本专利技术针对现有技术的缺点,提供了一种用于采集票据信息的方法、装置、计算机设备和存储介质,本专利技术实施例能够提高票据信息的识别成功率和准确率,且可应用于各类型的票据。本专利技术根据第一方面提供了一种票据信息采集方法,在一个实施例中,该方法包括:获取目标票据图片;通过第一字符识别模型对目标票据图片进行识别,得到票面识别结果;根据票面识别结果获得目 ...
【技术保护点】
1.一种票据信息采集方法,其特征在于,所述方法包括:/n获取目标票据图片;/n通过第一字符识别模型对所述目标票据图片进行识别,得到票面识别结果;/n根据所述票面识别结果获得所述目标票据图片的票据关键字段信息;/n根据所述目标票据图片的票据关键字段信息获得所述目标票据图片的票面详细信息。/n
【技术特征摘要】
1.一种票据信息采集方法,其特征在于,所述方法包括:
获取目标票据图片;
通过第一字符识别模型对所述目标票据图片进行识别,得到票面识别结果;
根据所述票面识别结果获得所述目标票据图片的票据关键字段信息;
根据所述目标票据图片的票据关键字段信息获得所述目标票据图片的票面详细信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标票据图片的第一票据类型,所述目标票据图片的第一票据类型为标准票据或者非标准票据。
3.根据权利要求2所述的方法,其特征在于,在确定所述目标票据图片的第一票据类型为标准票据时,
所述票面识别结果包括所述目标票据图片的第二票据类型、所述目标票据图片中的文字内容信息和所述目标票据图片中的文字位置信息;
所述通过第一字符识别模型对所述目标票据图片进行识别,得到票面识别结果包括:
通过目标检测模型对所述目标票据图片进行识别,得到所述目标票据图片的第二票据类型和所述目标票据图片中的文字框位置信息;
根据所述目标票据图片中的文字框位置信息对所述目标票据图片进行文字内容识别,得到所述目标票据图片中的文字内容信息和所述目标票据图片中的文字位置信息。
4.根据权利要求2所述的方法,其特征在于,在确定所述目标票据图片的第一票据类型为标准票据时,
所述根据所述票面识别结果获得所述目标票据图片的票据关键字段信息包括:
根据所述票面识别结果确定第一专项模型;
通过所述第一专项模型对所述目标票据图片进行识别,得到所述目标票据图片的票据关键字段信息。
5.根据权利要求4所述的方法,其特征在于,所述通过所述第一专项模型对所述目标票据图片进行识别,得到所述目标票据图片的票据关键字段信息包括:
获取所述目标票据图片对应的票据模板,所述票据模板上标定有关键字段位置信息;
对所述目标票据图片进行缩放处理,使得所述目标票据图片的像素数量与所述目标票据图片对应的票据模板相匹配,得到待识别目标票据图片;
根据所述票据模板上标定的关键字段位置信息对所述待识别目标票据图片进行字符识别,得到所述目标票据图片的票据关键字段信息。
6.根据权利要求2所述的方法,其特征在于,在确定所述目标票据图片的第一票据类型为非标准票据时,
所述根据所述票面识别结果获得所述目标票据图片的票据关键字段信息包括:
根据所述票面识别结果确定所述目标票据图片的第三票据类型;
根据所述目标票据图片的第三票据类型确定第二专项模型;
通过所述第二专项模型对所述票面识别结果进行处理,得到所述目标票据图片的票据关键字段信息;
优选地,所述根据...
【专利技术属性】
技术研发人员:徐伟豪,赵娟,彭举,胡帅,范为军,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。