【技术实现步骤摘要】
发票信息挖掘方法、装置、计算机设备及存储介质
本专利技术涉及数据挖掘领域,特别是涉及一种发票信息挖掘方法、装置、计算机设备及存储介质。
技术介绍
目前不少银行有针对企业提供凭发票贷款业务,企业只需将发票提供给银行进行审核,即有可能获得贷款,当前银行利用发票主要是计算企业的发票指标,了解企业的经营状况,没有发挥发票数据的全部价值,浪费了不易得来的发票数据。
技术实现思路
有鉴于此,本专利技术提出一种发票信息挖掘方法、装置、计算机设备及存储介质,能够通过发票数据与大数据构建知识图谱以进行数据挖掘,充分利用发票数据。首先,为实现上述目的,本专利技术提出一种发票信息挖掘方法,所述方法包括接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;爬取源企 ...
【技术保护点】
1.一种发票信息挖掘方法,其特征在于,所述方法包括/n接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;/n提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;/n根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;/n爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;/n根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。/n
【技术特征摘要】
1.一种发票信息挖掘方法,其特征在于,所述方法包括
接收从源企业端获取的录有源企业的发票文件的发票数据集,所述发票数据包括电子发票及纸质发票;
提取所述发票文件中的发票数据,所述发票数据包括与所述源企业关联的上下游企业数据;
根据所述发票数据形成以所述源企业为核心的上下游企业关系网络,其中,所述上下游企业关系网络包含源企业与若干关联企业;
爬取源企业与各关联企业的数据,并结合所述上下游企业关系网络生成知识图谱;
根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端。
2.由权利要求1所述的发票信息挖掘方法,其特征在于,所述根据所述知识图谱分析所述各关联企业的风险值,并将风险信息推送至源企业端包括:
根据源企业与各关联企业的信息的各维度数据对各关联企业的企业风险分别进行分析,得出各自的风险值;
生成风险值低于设定阈值的高风险关联企业的清单,生成风险信息,进行推送。
3.由权利要求2所述的发票信息挖掘方法,其特征在于,所述生成风险值低于设定阈值的关联企业的清单之后还包括:
从所述知识图谱获取所述高风险关联企业与源企业之间的交易产品信息,所述交易产品信息为知识图谱根据所述发票数据得到;
根据所述交易产品信息从优质企业库中搜索相关优质企业;
输出搜索到的相关优质企业的数据作为推荐供应商或客户。
4.由权利要求2所述的发票信息挖掘方法,其特征在于,根据源企业与各关联企业的信息对各关联企业的企业风险进行单独预测,得出各自的风险值之后还包括:
计算所述上下游企业关系网络中关联企业对所述源企业的总体影响值;
根据所述源企业的各维度数据、风险值以及所述总体影响值为源企业适配金融产品。
5.由权利要求4所述的发票信息挖掘方法...
【专利技术属性】
技术研发人员:王盼,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。