本发明专利技术公开了一种发票信息挖掘方法、装置、计算机设备及存储介质,所述方法包括接收从源企业端获取的录有源企业的发票文件的发票数据集;提取所述发票文件中的发票数据;根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。发票信息挖掘方法、装置、计算机设备及存储介质,通过发票数据与大数据构建出以源企业为核心的知识图谱,可利用知识图谱进行数据挖掘,增强风控能力,为银行与源企业的决策提供参考。
Invoice information mining methods, devices, computer equipment and storage media
【技术实现步骤摘要】
发票信息挖掘方法、装置、计算机设备及存储介质
本专利技术涉及数据挖掘领域,特别是涉及一种发票信息挖掘方法、装置、计算机设备及存储介质。
技术介绍
目前不少银行有针对企业提供凭发票贷款业务,企业只需将发票提供给银行进行审核,即有可能获得贷款,当前银行利用发票主要是计算企业的发票指标,了解企业的经营状况,没有发挥发票数据的全部价值,浪费了不易得来的发票数据。
技术实现思路
有鉴于此,本专利技术提出一种发票信息挖掘方法、装置、计算机设备及存储介质,能够通过发票数据与大数据构建知识图谱以进行数据挖掘,充分利用发票数据。首先,为实现上述目的,本专利技术提出一种发票信息挖掘方法,所述方法包括接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。进一步地,所述根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端包括根据源企业与各关联企业的信息的各维度数据对各关联企业的企业风险分别进行分析,得出各自的风险值;生成风险值低于设定阈值的高风险关联企业的清单,生成风险信息,进行推送。进一步地,所述生成风险值低于设定阈值的关联企业的清单之后还包括从所述知识图谱获取所述高风险关联企业与源企业之间的交易产品信息,所述交易产品信息为知识图谱根据所述发票数据得到;根据所述交易产品信息从优质企业库中搜索相关优质企业;输出搜索到的相关优质企业的数据作为推荐供应商或客户。进一步地,根据源企业与各关联企业的信息对各关联企业的企业风险进行单独预测,得出各自的风险值之后还包括计算所述上下游企业关系网络中关联企业对所述源企业的总体影响值;根据所述源企业的各维度数据、风险值以及所述总体影响值为源企业适配金融产品。进一步地,所述计算所述上下游企业关系网络的总体影响值具体包括为所述上下游企业关系网络中的各关联企业分配权重;计算各关联企业权重与风险值的乘积得到各关联企业对源企业的影响值;计算所有关联企业影响值的总和得到总体影响值。进一步地,所述计算所述上下游企业关系网络中关联企业对所述源企业的总体影响值之后还包括判断所述源企业的风险值以及所述上下游企业关系网络的总体影响值是否分别高于设定阈值;是则将所述源企业作为有资格进入优质企业库的优质企业。进一步地,所述根据所述发票数据形成以所述源企业为核心的上下游企业关系网络之前还包括验证各条发票数据的合法性,剔除其中的无效发票数据;提取有效的发票数据中开票金额超过设定阈值的发票数据。为实现上述目的,本专利技术还提供一种发票信息挖掘装置,其特征在于,其包括读取模块,适于读取录有源企业的发票数据的发票数据集;第一生成模块,适于根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;第二生成模块,适于获取源企业与各关联企业的指定维度的信息,并结合所述上下游企业关系网络生成知识图谱;分析模块,适于根据所述知识图谱进行信息挖掘。为实现上述目的,本专利技术还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述发票信息挖掘方法。为实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述发票信息挖掘方法。相较于现有技术,本专利技术所提出的发票信息挖掘方法、装置、计算机设备及存储介质,通过发票数据与大数据构建出以源企业为核心的知识图谱,可利用知识图谱进行数据挖掘,增强风控能力,为银行与源企业的决策提供参考。附图说明图1是本专利技术实施例一之发票信息挖掘方法的流程示意图;图2是本专利技术实施例之根据所述知识图谱进行信息挖掘的流程示意图;图3是本专利技术实施例之根据源企业情况适配金融产品的流程示意图;图4是本专利技术实施例之计算上下游企业关系网络中关联企业对所述源企业的总体影响值的流程示意图;图5是本专利技术实施例之判断源企业是否有资格进入优质企业库的流程示意图;图6是本专利技术实施例之发票信息挖掘装置的的程序模块示意图;图7是本专利技术第三实施例之计算机设备的硬件结构示意图;图8是本专利技术第四实施例之计算机设备的硬件结构示意图。附图标记发票信息挖掘装置700、804读取模块701提取模块702第一生成模块703第二生成模块704分析模块705计算机设备800存储器801处理器802网络接口803本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。实施例一参阅图1,是本专利技术第一实施例之发票信息挖掘方法,所述方法包括如下步骤S101-S104:步骤S101,接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;步骤S102,提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;此处,源企业为向银行提出贷款申请的企业或银行的现有客户,发票数据集中的发票数据由源企业提供,其中纸质发票可由扫描仪扫描为电子版本的发票,并经过计算机进行OCR识别将发票中记载的数据存储为可读本文档来自技高网...
【技术保护点】
1.一种发票信息挖掘方法,其特征在于,所述方法包括/n接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;/n提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;/n根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;/n爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;/n根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。/n
【技术特征摘要】
1.一种发票信息挖掘方法,其特征在于,所述方法包括
接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;
提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;
根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;
爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;
根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。
2.由权利要求1所述的发票信息挖掘方法,其特征在于,所述根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端包括:
根据源企业与各关联企业的信息的各维度数据对各关联企业的企业风险分别进行分析,得出各自的风险值;
生成风险值低于设定阈值的高风险关联企业的清单,生成风险信息,进行推送。
3.由权利要求2所述的发票信息挖掘方法,其特征在于,所述生成风险值低于设定阈值的关联企业的清单之后还包括:
从所述知识图谱获取所述高风险关联企业与源企业之间的交易产品信息,所述交易产品信息为知识图谱根据所述发票数据得到;
根据所述交易产品信息从优质企业库中搜索相关优质企业;
输出搜索到的相关优质企业的数据作为推荐供应商或客户。
4.由权利要求2所述的发票信息挖掘方法,其特征在于,根据源企业与各关联企业的信息对各关联企业的企业风险进行单独预测,得出各自的风险值之后还包括:
计算所述上下游企业关系网络中关联企业对所述源企业的总体影响值;
根据所述源企业的各维度数据、风险值以及所述总体影响值为源企业适配金融产品。
5.由权利要求4所述的发票信息挖掘方法...
【专利技术属性】
技术研发人员:王盼,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。