【技术实现步骤摘要】
电子发票识别方法、系统、电子设备和介质
[0001]本专利技术涉及信息识别
,特别涉及一种电子发票识别方法、系统、电子设备和介质。
技术介绍
[0002]随着信息时代的发展,越来越多的商家选择开具电子发票,与传统纸质发票相比,电子发票具有无纸化、低能耗、易保存等特点,但是在核对发票信息时,需要人工介入去识别电子发票的内容,存在工作量大、效率低的问题。现有技术中存在一种电子发票识别方法,通过OCR(一种文字识别)技术将电子发票全部转化为电子数据,再从中提取有用的发票信息,但是在电子发票上有许多干扰项,导致无法快速的获取到所需的发票内容,使得识别的效率很低,并且由于不同省份的电子发票格式各有差异,如回车空行等,导致无法准确的获取到所需的发票内容,造成识别的准确率下降,甚至可能无法识别。
技术实现思路
[0003]本专利技术要解决的技术问题是为了克服现有技术中识别电子发票存在识别效率低和识别准确率低的缺陷,提供一种电子发票识别方法、系统、电子设备和介质。
[0004]本专利技术是通过下述技术方案来解决
【技术保护点】
【技术特征摘要】
1.一种电子发票识别方法,其特征在于,包括以下步骤:获取所述电子发票的发票名称;根据所述发票名称选择对应的发票识别模板;根据所述发票识别模板确定所述电子发票的待识别区域并进行识别。2.根据权利要求1所述的电子发票识别方法,其特征在于,所述获取所述电子发票的发票名称的步骤包括:识别所述电子发票的文件类型,根据所述文件类型确定提取方法;根据所述提取方法提取所述电子发票的文本数据;根据所述文本数据确定所述发票名称。3.根据权利要求2所述的电子发票识别方法,其特征在于,所述文件类型包括PDF文件和OFD文件。4.根据权利要求1所述的电子发票识别方法,其特征在于,所述根据所述发票识别模板确定所述电子发票的待识别区域并进行识别的步骤包括:根据所述发票识别模板截取所述电子发票,得到所述待识别区域;识别所述待识别区域得到关键词;根据所述关键词获取发票信息。5.根据权利要求4所述的电子发票识别方法,其特征在于,所述关键词包括发票代码、发票号码、开票日期、名称、纳税人识别号、项目名称、金额、税率和备注中的至少一种;所述发票信息包括发票代码信息、发票号码信息、开票日期信息、购方名称信息、购方纳税人识别号信息、项目名称信息、金额信息、税率信息、...
【专利技术属性】
技术研发人员:张帆,黄鹏,
申请(专利权)人:携程计算机技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。