一种用于银行风险评估的异构图知识图谱补全方法及系统技术方案

技术编号:38657575 阅读:9 留言:0更新日期:2023-09-02 22:42
本发明专利技术提出了一种用于银行风险评估的异构图知识图谱补全方法及系统,涉及知识图谱补全技术领域,具体方案为:获取待评估客户的风险识别数据,根据不同的语义关联关系,构建风险识别数据异构图;基于险识别数据异构图,通过基于分层注意力的编码器,提取实体嵌入;同时对原始关系进行向量化表示,生成关系嵌入;利用解码器处理所述实体嵌入和关系嵌入,更新风险识别知识图谱;本发明专利技术利用异构图的图结构特性,通过加入改进的分层注意力机制来更新实体的特征表示,得到实体嵌入,通过改进的解码器使关系和实体之间保持翻译的特性,实现更好的链路预测性能。的链路预测性能。的链路预测性能。

【技术实现步骤摘要】
一种用于银行风险评估的异构图知识图谱补全方法及系统


[0001]本专利技术属于知识图谱补全
,尤其涉及一种用于银行风险评估的异构图知识图谱补全方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]知识图谱补全的主要目的是预测三元组缺失的部分,目前,知识图谱在银行领域的应用非常广泛,基于知识图谱在深度感知数据、广泛互联孤立数据、高度智能共享分析数据的特点,知识图谱可以帮助从业人员进行业务场景的分析与决策,有利于建立客户画像、进行精准营销获客,识别银行风险,发现信用卡套现、资金挪用等行为,更好地表达、分析金融业务场景的交易全貌。
[0004]银行风险,主要指商业银行的信贷风险,是指在个人信贷业务办理中,借款人没有按照一定的时间履行银行的相关约定,导致银行无法按时收回资金,造成银行资金的损失;信贷风险是个人信贷业务中的一个重要问题,它主要来自于借款人的收入不稳定和诚信缺失;具体表现为:借款人在申请贷款时或者在银行留下的信息中存在虚假或不实的情况,或者在贷款后还款意愿降低,不能按时履行合约,或者经常变更工作和住址,或者有过多的债务负担,或者借款用途不明确等等,这些因素都会增加银行的信贷损失;而且在信息不对称的情况下,借款人更容易采取欺诈、造假等手段来骗取银行的资金;这些问题的根本原因是银行对借款人的各种信息了解不够,不清楚借款人的社会关系特点;另外,银行也不能有效地利用自身的数据和大量的外部数据资源作为平台的支撑,合理地运用多源异构的数据来识别个人信贷业务。
[0005]利用知识图谱综合不同的数据类型,将不同结构的信息结合在一起,得到一个风险识别知识图谱,用来识别银行风险;但现有的知识图谱补全,存在诸多问题:现有的翻译模型、语义匹配模型以及神经网络模型在处理三元组缺失问题时,独立地对待三元组,忽略了三元组周围邻域内隐藏的实体信息和丰富的语义关系,且模型结构相对简单,表达能力较差,而现有的神经网络模型容易忽略三元组的整体结构特征,无法捕捉低维空间中实体和关系之间的联系,忽略了三元组之间的转换特征;虽然有的图神经网络模型可以利用图连通性的结构特点,从邻近实体和关系中学习更为丰富的语义信息,但是并没有充分考虑对于包含不同类型实体和关系的异构图,对于中心实体的更新冗杂了很多信息;因此,基于上述问题,通过现有的知识图谱去构建风险识别知识图谱存在数据信息不准确,不全面等诸多问题,不能完整充分利用不同结构的数据,从而无法经行准备的风险评估。

技术实现思路

[0006]为了解决上述存在的问题,本专利技术提供了一种用于银行风险评估的异构图知识图谱补全方法及系统,利用异构图的结构特性,采用编码器

解码器的模型结构,通过加入分
层注意力机制来有效融合邻居实体节点的信息,从而更新中心实体节点的特征表示作为编码器,最后通过改进的解码器Conv

transE,得到每个实体的得分,从而有效提高风险识别知识图谱的准确性。
[0007]根据本专利技术实施例的第一个方面,提供了一种用于银行风险评估的异构图知识图谱补全方法,包括:
[0008]获取待评估客户的风险识别数据,根据不同的语义关联关系,构建风险识别数据异构图;
[0009]基于风险识别数据异构图,通过基于分层注意力的编码器,提取实体嵌入;同时对原始关系进行向量化表示,生成关系嵌入;
[0010]利用解码器处理所述实体嵌入和关系嵌入,更新风险识别知识图谱;
[0011]其中,所述基于分层注意力的编码器,包括实体注意力层和语义注意力层,实体注意力层聚合不同元路径的邻居特征,语义注意力层区别不同元路径的重要性,编码器通过分层方式聚合元路径的邻居特征,得到实体嵌入。
[0012]进一步的,所述风险识别数据,包括客户信贷数据、消费数据和个人信息文本数据;
[0013]所述客户信贷数据,包括借贷的频率、相互借贷关系;
[0014]所述消费数据,包括相关平台的消费频率、消费偏好;
[0015]所述个人信息文本数据,是个人的基本信息,包括个人身份信息、学历、工作单位。
[0016]进一步的,所述风险识别数据异构图,以实体为节点,以实体之间不同的语义关联关系为边;两个实体通过不同的语义路径进行连接,这些路径称为元路径。
[0017]进一步的,所述实体注意力层,加深学习元路径的邻居对于异构图中每个实体的重要性,同时聚合邻居实体信息更新中心实体的嵌入表示。
[0018]进一步的,所述语义注意力层,学习语义的重要性并融合多个不同元路径下的实体表示。
[0019]进一步的,所述解码器,采用Conv

transE的卷积网络,是在ConvE模型基础上,去掉重塑步骤,直接对实体嵌入和关系嵌入进行卷积操作,保留翻译特性。
[0020]进一步的,所述解码器,以编码器更新后的实体嵌入和向量化的关系嵌入作为输入,输出实体的评分,以评分作为判断实体之间关联性强度的依据,选取评分高的实体进行三元组补全。
[0021]本专利技术第二方面提供了一种用于银行风险评估的异构图知识图谱补全系统。
[0022]一种用于银行风险评估的异构图知识图谱补全系统,包括异构图构建模块、特征编码模块和风险识别知识图谱补全模块;
[0023]异构图构建模块,被配置为:获取待评估客户的风险识别数据,根据不同的语义关联关系,构建风险识别数据异构图;
[0024]特征编码模块,被配置为:基于风险识别数据异构图,通过基于分层注意力的编码器,提取实体嵌入,同时对原始关系进行向量化表示,生成关系嵌入;
[0025]风险识别知识图谱补全模块,被配置为:利用解码器处理所述实体嵌入和关系嵌入,最终更新风险识别知识图谱。
[0026]其中,所述基于分层注意力的编码器,包括实体注意力层和语义注意力层,实体注
意力层聚合不同元路径的邻居特征,语义注意力层区别不同元路径的重要性,编码器通过分层方式聚合元路径的邻居特征,得到实体嵌入。
[0027]本专利技术第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本专利技术第一方面所述的一种用于银行风险评估的异构图知识图谱补全方法中的步骤。
[0028]本专利技术第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本专利技术第一方面所述的一种用于银行风险评估的异构图知识图谱补全方法中的步骤。
[0029]以上一个或多个技术方案存在以下有益效果:
[0030]本专利技术通过改进注意力的异构图神经网络知识图谱补全方法,构建知识图谱补全框架来实现对缺失知识图谱的不断更新完善,引入注意力机制更好地理解知识图谱中的实体和关系之间的语义信息,充分地利用了图结构信息,从而能更准确地进行知识推理、链路预测。
[0031]解码器模块采用Conv

tr本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于银行风险评估的异构图知识图谱补全方法,其特征在于,包括:获取待评估客户的风险识别数据,根据不同的语义关联关系,构建风险识别数据异构图;基于风险识别数据异构图,通过基于分层注意力的编码器,提取实体嵌入;同时对原始关系进行向量化表示,生成关系嵌入;利用解码器处理所述实体嵌入和关系嵌入,更新风险识别知识图谱;其中,所述基于分层注意力的编码器,包括实体注意力层和语义注意力层,实体注意力层聚合不同元路径的邻居特征,语义注意力层区别不同元路径的重要性,编码器通过分层方式聚合元路径的邻居特征,得到实体嵌入。2.如权利要求1所述的一种用于银行风险评估的异构图知识图谱补全方法,其特征在于,所述风险识别数据,包括客户信贷数据、消费数据和个人信息文本数据;所述客户信贷数据,包括借贷的频率、相互借贷关系;所述消费数据,包括相关平台的消费频率、消费偏好;所述个人信息文本数据,是个人的基本信息,包括个人身份信息、学历、工作单位。3.如权利要求1所述的一种用于银行风险评估的异构图知识图谱补全方法,其特征在于,所述风险识别数据异构图,以实体为节点,以实体之间不同的语义关联关系为边;两个实体通过不同的语义路径进行连接,这些路径称为元路径。4.如权利要求3所述的一种用于银行风险评估的异构图知识图谱补全方法,其特征在于,所述实体注意力层,加深学习元路径的邻居对于异构图中每个实体的重要性,同时聚合邻居实体信息更新中心实体的嵌入表示。5.如权利要求3所述的一种用于银行风险评估的异构图知识图谱补全方法,其特征在于,所述语义注意力层,学习语义的重要性并融合多个不同元路径下的实体表示。6.如权利要求1所述的一种用于银行风险评估的异构图知识图谱补全方法,...

【专利技术属性】
技术研发人员:赵晶时俊康
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1