【技术实现步骤摘要】
一种基于知识图谱的关联交易挖掘识别方法及装置
本专利技术涉及信息系统
,尤其是涉及一种基于知识图谱的关联交易挖掘识别方法及装置。
技术介绍
关联交易是企业关联方之间的交易,它是公司运作中经常出现而又易于发生不公平结果的交易。在理想状态下,只要是企业集团正常经营和发展的需要,而且交易不损害其他方利益,关联交易则是一种正当的交易行为。然而,部分企业在利用关联交易降低交易成本,提高公司运行效率的同时,企业控股股东通过关联交易操纵利润、粉饰业绩、侵害中小股东利益。因此,关联交易的非良性滋长无论在规模、性质还是其外部危害,都警示我们需要在金融和经济安全的高度重新认识关联交易问题的严重性,识别关联交易以及如何有效地识别关联交易便成为交易行为中不容忽视的一环。然而,由于信息不对称、不共享和关联交易的复杂性、隐蔽性和强力的利益驱动,及时地识别关联交易并有效地予以管理和规范并不容易。现有手段下,识别关联交易主要依赖目标企业主动申报以及从工商信息等角度手工搜索,效率极低且很难有效识别被隐藏或粉饰的关联交易。通过知识图谱的手段,可有效增强关联交易的识别效率且一定程度上通过其多维度的穿透能力可识别隐藏的关联交易。
技术实现思路
有鉴于此,本专利技术旨在提供一种基于知识图谱的关联交易挖掘识别方法及装置,能够通过图谱中各关系识别双方是否存在可能的关联关系,并与客户交易相匹配,从而产生关联交易预警。根据本专利技术的第一方面,提供了一种基于知识图谱的关联交易挖掘识别方法,所述方法用于挖掘并识别关联交易,包括 ...
【技术保护点】
1.一种基于知识图谱的关联交易挖掘识别方法,所述方法用于挖掘并识别关联交易,其特征在于,包括以下步骤:/nS1:获取目标数据,清洗筛选出可信数据;/nS2:对所述可信数据进行实体抽取和实体间对应关系抽取,将抽取后得到的实体和实体间对应关系导入图数据库,生成初步知识图谱;/nS3:从所述初步知识图谱中查找满足关联规则的节点对,将节点对之间的关联关系添入S2中的所述图数据库,获得完善知识图谱;/nS4:在所述完善知识图谱的基础上,通过图表示学习算法进一步增加关联关系,得到最终知识图谱;/nS5:利用所述最终知识图谱识别关联交易信息。/n
【技术特征摘要】
1.一种基于知识图谱的关联交易挖掘识别方法,所述方法用于挖掘并识别关联交易,其特征在于,包括以下步骤:
S1:获取目标数据,清洗筛选出可信数据;
S2:对所述可信数据进行实体抽取和实体间对应关系抽取,将抽取后得到的实体和实体间对应关系导入图数据库,生成初步知识图谱;
S3:从所述初步知识图谱中查找满足关联规则的节点对,将节点对之间的关联关系添入S2中的所述图数据库,获得完善知识图谱;
S4:在所述完善知识图谱的基础上,通过图表示学习算法进一步增加关联关系,得到最终知识图谱;
S5:利用所述最终知识图谱识别关联交易信息。
2.根据权利要求1所述的一种基于知识图谱的关联交易挖掘识别方法,其特征在于,所述S1具体包括:
S11:利用爬虫手段在网站上爬取所需信息,并结合内部信息,将得到的全部信息作为目标数据;
S12:剔除目标数据中错误、重复及无关的信息,得到清洗后数据;
S13:根据信息来源为清洗后数据中的每条信息设置权重系数,并计算得到每条信息的可信度;
S14:设置置信阈值为正数,从清洗后数据中剔除可信度低于所述置信阈值的信息,将剩余信息作为可信数据。
3.根据权利要求2所述的一种基于知识图谱的关联交易挖掘识别方法,其特征在于,所述信息来源包括多级别信息来源,信息来源的级别越高,为从中得到的信息设置的权重系数越大。
4.根据权利要求3所述的一种基于知识图谱的关联交易挖掘识别方法,其特征在于,所述计算得到每条信息的可信度,具体包括:
设来自信息来源I1,I2,…,In-1,In的信息的权重系数分别为ω1,ω2,…,ωn-1,ωn,所述权重系数为正数,n为正整数;
取来自信息来源Ii的一条信息Xi,其中i=1,2,…,n-1,n,用来自其他信息来源Ik的与信息Xi有逻辑关系的信息Xk进行交叉验证,其中k≠i,k=1,2,…,n-1,n,交叉验证得到信息Xi又一次正确的概率为pk,则信息Xi的可信度C(Xi)表示为:
C(Xi)=ωi*1+∑ωkpk。
5.根据权利要求1所述的一种基于知识图谱的关联交易挖掘识别方法,其特征在于,所述S2具体包括:
S21:对所述可信数据进行实体抽取和实体间对应关系抽取,利用抽取后得...
【专利技术属性】
技术研发人员:李振,宋璞,刘恒,赵兴莹,秦培歌,李勇辉,
申请(专利权)人:民生科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。