发票信息近似度检测方法、存储介质及计算机设备技术

技术编号:37456502 阅读:31 留言:0更新日期:2023-05-06 09:28
本发明专利技术公开一种发票信息近似度检测方法、存储介质及计算机设备,属于电子信息加工处理技术领域。所述发票信息近似度检测方法,通过将发票信息中的至少两个核心项目的项目向量进行整合,能够为每张发票生成包含有综合信息的综合向量,由于该综合向量中包含语义信息,语义相似的内容生成的向量也相似;然后通过比对不同发票的综合向量彼此间的距离,确定发票彼此间的信息近似度,从而为发票近似度查询、违规开票的情形提供信息支撑。违规开票的情形提供信息支撑。违规开票的情形提供信息支撑。

【技术实现步骤摘要】
发票信息近似度检测方法、存储介质及计算机设备


[0001]本专利技术属于电子信息加工处理
,具体涉及发票信息近似度检测方法、存储介质及计算机设备。

技术介绍

[0002]现有的发票信息处理,主要是将发票中某些核心信息进行识别和提取,然后在数据库中分字段进行简单存储,以供查询、统计等使用。在发票信息的近似度监测方面上,还没有相关的技术。具体地,关于发票信息的提取,现有技术仅是基于图像识别或语义识别对各个单项分别进行信息提取,例如,将一张发票上的购买方、销售方、业务、金额、开票日期等单项信息分别进行提取并存储。现有技术并没有对发票各核心项信息进行综合处理,也没有利用处理结果进行发票近似度的检测。

技术实现思路

[0003]本专利技术旨在提供一种发票信息近似度检测方法、存储介质及计算机设备,能够进行发票近似度的检测。本专利技术通过下述技术方案来实现:一种发票信息近似度检测方法,包括:(1)预先指定发票信息中的至少两个核心项目;(2)获取被检测发票中各核心项目的对应信息,将各核心项目的对应信息分别转换为一个项目向量;(3)将至少两本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种发票信息近似度检测方法,其特征在于,包括:(1)预先指定发票信息中的至少两个核心项目;(2)获取被检测发票中各核心项目的对应信息,将各核心项目的对应信息分别转换为一个项目向量;(3)将至少两个核心项目对应的所述项目向量拼接,构成一综合向量;(4)通过比对不同发票的综合向量彼此间的相对距离,确定发票彼此间的信息近似度。2.根据权利要求1所述的发票信息近似度检测方法,其特征在于,步骤(1)中的所述核心项目包括购买方名称、销售方名称、业务内容;步骤(2)中,将购买方名称划分为a个词语,将销售方名称划分为b个词语,将业务内容划分为c个词语;通过词向量算法,将购买方名称信息转换为a个N维的购买方名称向量V1‑1,将销售方名称信息转换为b个N维的销售方名称向量V1‑2,将业务内容信息转换为c个N维的业务内容向量V2。3.根据权利要求2所述的发票信息近似度检测方法,其特征在于,步骤(3)具体包括:S3

1、将购买方名称向量和销售方名称向量按维度求平均,求得1个N维的平均值向量;S3

2、将购买方名称向量和销售方名称向量按维度求最大值,求得1个N维的最大值向量;S3

3、将所述平均值向量和最大值向量拼接到一起,得到一个2N维的购销合并向量 V1;S3

4、将V1和V2进行拼接,构成所述综合向量V。4.根据权利要求2所述的发票信息近似度检测方法,其特征在于,步骤(1)中的所述核心项目还包括开票金额和开票日期;步骤(2)还包括:通过一第一预设算法将开票金额信息转换为1个1维的开票金额向量V3,通过一第二预设算法将开票日期信息转换为1个1维的开票日期...

【专利技术属性】
技术研发人员:孙元臻王宇
申请(专利权)人:得分数字科技珠海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1