电子发票识别方法、系统、电子设备和介质技术方案

技术编号:32854666 阅读:34 留言:0更新日期:2022-03-30 19:23
本发明专利技术公开了一种电子发票识别方法、系统、电子设备和介质,电子发票识别方法包括以下步骤:获取电子发票的发票名称;根据发票名称选择对应的发票识别模板;根据所述发票识别模板确定所述电子发票的待识别区域并进行识别。本发明专利技术针对不同格式的电子发票制作发票识别模板,每个发票识别模板对应不同的待识别区域,并且传入发票名称作为参数,对接相应的发票识别模板,通过发票识别模板来截取电子发票上的待识别区域,并对待识别区域中的发票信息进行识别,通过划分区域,减少了电子发票数据的干扰项,能够比较快速精确的提取到所需的电子发票数据,并且适应不同的发票格式,从而有效地提高了电子发票识别的效率和准确率。效地提高了电子发票识别的效率和准确率。效地提高了电子发票识别的效率和准确率。

【技术实现步骤摘要】
电子发票识别方法、系统、电子设备和介质


[0001]本专利技术涉及信息识别
,特别涉及一种电子发票识别方法、系统、电子设备和介质。

技术介绍

[0002]随着信息时代的发展,越来越多的商家选择开具电子发票,与传统纸质发票相比,电子发票具有无纸化、低能耗、易保存等特点,但是在核对发票信息时,需要人工介入去识别电子发票的内容,存在工作量大、效率低的问题。现有技术中存在一种电子发票识别方法,通过OCR(一种文字识别)技术将电子发票全部转化为电子数据,再从中提取有用的发票信息,但是在电子发票上有许多干扰项,导致无法快速的获取到所需的发票内容,使得识别的效率很低,并且由于不同省份的电子发票格式各有差异,如回车空行等,导致无法准确的获取到所需的发票内容,造成识别的准确率下降,甚至可能无法识别。

技术实现思路

[0003]本专利技术要解决的技术问题是为了克服现有技术中识别电子发票存在识别效率低和识别准确率低的缺陷,提供一种电子发票识别方法、系统、电子设备和介质。
[0004]本专利技术是通过下述技术方案来解决上述技术问题:...

【技术保护点】

【技术特征摘要】
1.一种电子发票识别方法,其特征在于,包括以下步骤:获取所述电子发票的发票名称;根据所述发票名称选择对应的发票识别模板;根据所述发票识别模板确定所述电子发票的待识别区域并进行识别。2.根据权利要求1所述的电子发票识别方法,其特征在于,所述获取所述电子发票的发票名称的步骤包括:识别所述电子发票的文件类型,根据所述文件类型确定提取方法;根据所述提取方法提取所述电子发票的文本数据;根据所述文本数据确定所述发票名称。3.根据权利要求2所述的电子发票识别方法,其特征在于,所述文件类型包括PDF文件和OFD文件。4.根据权利要求1所述的电子发票识别方法,其特征在于,所述根据所述发票识别模板确定所述电子发票的待识别区域并进行识别的步骤包括:根据所述发票识别模板截取所述电子发票,得到所述待识别区域;识别所述待识别区域得到关键词;根据所述关键词获取发票信息。5.根据权利要求4所述的电子发票识别方法,其特征在于,所述关键词包括发票代码、发票号码、开票日期、名称、纳税人识别号、项目名称、金额、税率和备注中的至少一种;所述发票信息包括发票代码信息、发票号码信息、开票日期信息、购方名称信息、购方纳税人识别号信息、项目名称信息、金额信息、税率信息、...

【专利技术属性】
技术研发人员:张帆黄鹏
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1