一种电子发票识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33135043 阅读:19 留言:0更新日期:2022-04-17 00:58
本申请实施例属于人工智能中的图像处理技术领域,涉及一种电子发票识别方法、装置、计算机设备及存储介质。本申请通过将原始发票图像分割成二维码分割图像和文本分割图像,并分别从二维码渠道和文本渠道获取各自的发票内容,最终进行校验匹配,得到有效的目标发票内容信息,有效提高电子发票识别方法的识别效率以及识别准确度。以及识别准确度。以及识别准确度。

【技术实现步骤摘要】
一种电子发票识别方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能中的图像处理
,尤其涉及一种电子发票识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着科技水平的提高,电子发票相较于纸质发票有着很大的优势,比如方便快捷易保存,不仅如此,对于利用发票进行报销也方便许多。在保险场景亦是如此,尤其有理赔环节,保险场景存在大量的医疗电子发票需要进行处理。
[0003]现有一种电子发票识别方法,主要依靠人工审核和验票。
[0004]然而,申请人发现传统的发票真伪验证普遍不智能,无法从质量和数量上保证发票管理到位,由此可见,传统的电子发票识别方法存在准确度较低的问题。

技术实现思路

[0005]本申请实施例的目的在于提出一种电子发票识别方法、装置、计算机设备及存储介质,以解决传统的电子发票识别方法存在准确度较低的问题。
[0006]为了解决上述技术问题,本申请实施例提供一种电子发票识别方法,采用了如下所述的技术方案:
[0007]获取待识别的原始发票图像
[000本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子发票识别方法,其特征在于,包括下述步骤:获取待识别的原始发票图像;对所述原始发票图像进行类型识别操作,得到发票类型信息;读取本地数据库,在所述本地数据库中获取与所述发票类型信息相对应的分割模板数据;根据所述分割模板数据对所述原始发票图像进行图像分割操作,得到二维码分割图像以及文本分割图像;对所述二维码分割图像进行二维码解析操作,得到第一发票内容信息;对所述文本分割图像进行文本识别操作,得到第二发票内容信息;对所述第一发票内容信息以及所述第二发票内容信息进行校验匹配操作,得到目标发票内容信息。2.根据权利要求1所述的电子发票识别方法,其特征在于,所述对所述文本分割图像进行文本识别操作,得到第二发票内容信息的步骤,具体包括下述步骤:根据光学字符识别技术对所述文本分割图像进行光学字符识别,得到第二发票光学字符;将所述第二发票光学字符输入至语义分析模型进行语义分析操作,得到所述第二发票内容信息。3.根据权利要求2所述的电子发票识别方法,其特征在于,在所述将所述第二发票光学字符输入至语义分析模型进行语义分析操作,得到所述第二发票内容信息的步骤之前,具体包括下述步骤:在所述本地数据库中获取样本文本,并确定所述样本文本中包含的每个分词;基于待训练的语义分析模型确定所述每个分词对应的词向量;在所述本地数据库中获取每个语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量;根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述样本文本涉及每个语义属性的第一特征表示向量,确定所述样本文本涉及每个语义属性的第二特征表示向量;根据所述待训练的语义分析模型以及所述样本文本涉及每个语义属性的第二特征表示向量,确定所述待训练的语义训练模型输出的分类结果,所述分类结果包括所述样本文本所属的语义属性以及所述样本文本所属的语义属性对应的情感极性;根据所述分类结果和针对所述样本文本预设的标注,对所述语义分析模型中的模型参数进行调整,以完成对所述语义分析模型的训练。4.根据权利要求3所述的电子发票识别方法,其特征在于,在所述基于待训练的语义分析模型确定所述每个分词对应的词向量步骤,具体包括下述步骤:将所述每个分词输入所述语义分析模型中的语义表征层,得到所述语义表征层输出的每个分词分别对应的双向语义表示向量,作为每个分词对应的词向量。5.根据权利要求3所述的电子发票识别方法,其特征在于,所述在所述本地数据库中获取每个语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩
阵...

【专利技术属性】
技术研发人员:欧阳高询
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1