【技术实现步骤摘要】
发票信息近似度检测方法、存储介质及计算机设备
[0001]本专利技术属于电子信息加工处理
,具体涉及发票信息近似度检测方法、存储介质及计算机设备。
技术介绍
[0002]现有的发票信息处理,主要是将发票中某些核心信息进行识别和提取,然后在数据库中分字段进行简单存储,以供查询、统计等使用。在发票信息的近似度监测方面上,还没有相关的技术。具体地,关于发票信息的提取,现有技术仅是基于图像识别或语义识别对各个单项分别进行信息提取,例如,将一张发票上的购买方、销售方、业务、金额、开票日期等单项信息分别进行提取并存储。现有技术并没有对发票各核心项信息进行综合处理,也没有利用处理结果进行发票近似度的检测。
技术实现思路
[0003]本专利技术旨在提供一种发票信息近似度检测方法、存储介质及计算机设备,能够进行发票近似度的检测。本专利技术通过下述技术方案来实现:一种发票信息近似度检测方法,包括:(1)预先指定发票信息中的至少两个核心项目;(2)获取被检测发票中各核心项目的对应信息,将各核心项目的对应信息分别转换为一个项目 ...
【技术保护点】
【技术特征摘要】
1.一种发票信息近似度检测方法,其特征在于,包括:(1)预先指定发票信息中的至少两个核心项目;(2)获取被检测发票中各核心项目的对应信息,将各核心项目的对应信息分别转换为一个项目向量;(3)将至少两个核心项目对应的所述项目向量拼接,构成一综合向量;(4)通过比对不同发票的综合向量彼此间的相对距离,确定发票彼此间的信息近似度。2.根据权利要求1所述的发票信息近似度检测方法,其特征在于,步骤(1)中的所述核心项目包括购买方名称、销售方名称、业务内容;步骤(2)中,将购买方名称划分为a个词语,将销售方名称划分为b个词语,将业务内容划分为c个词语;通过词向量算法,将购买方名称信息转换为a个N维的购买方名称向量V1‑1,将销售方名称信息转换为b个N维的销售方名称向量V1‑2,将业务内容信息转换为c个N维的业务内容向量V2。3.根据权利要求2所述的发票信息近似度检测方法,其特征在于,步骤(3)具体包括:S3
‑
1、将购买方名称向量和销售方名称向量按维度求平均,求得1个N维的平均值向量;S3
‑
2、将购买方名称向量和销售方名称向量按维度求最大值,求得1个N维的最大值向量;S3
‑
3、将所述平均值向量和最大值向量拼接到一起,得到一个2N维的购销合并向量 V1;S3
‑
4、将V1和V2进行拼接,构成所述综合向量V。4.根据权利要求2所述的发票信息近似度检测方法,其特征在于,步骤(1)中的所述核心项目还包括开票金额和开票日期;步骤(2)还包括:通过一第一预设算法将开票金额信息转换为1个1维的开票金额向量V3,通过一第二预设算法将开票日期信息转换为1个1维的开票日期...
【专利技术属性】
技术研发人员:孙元臻,王宇,
申请(专利权)人:得分数字科技珠海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。