【技术实现步骤摘要】
一种基于知识图谱的贷款风险识别方法及装置
[0001]本专利技术涉及金融信息服务
,具体涉及一种基于知识图谱的贷款风险识别方法及装置。
技术介绍
[0002]随着中国国内市场日益活跃以及经济的飞速发展,企业以及个人对贷款的需求逐渐扩大,为了降低贷款逾期的风险,贷款预警的工作在贷前、贷中、贷后都有着十分重要的意义。
[0003]传统的贷款预警策略是通过领域内专家根据先验知识和规范条例来制定一些规则来判断当前贷款人是否面临贷款资金使用不规范或无法偿还的风险。随着贷款数据量的日益庞大,这种方式需要消耗大量的人力和时间成本,同时,贷款资金的流向也变得更广和更深,专家难以快速挖掘出在贷款资金流向过程中产生的隐含关联关系,因此,难以判断当前贷款是否存在较大风险,贷款的预警变得越来越困难。
技术实现思路
[0004]针对现有技术中的问题,本专利技术实施例提供一种基于知识图谱的贷款风险识别方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]一方面,本专利技术提出一种基于知识图谱的贷款风险识别方法,包括:
[0006]从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
[0007]根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
[0008]根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的贷款风险识别方法,其特征在于,包括:从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;根据各个第一三元组数据,获得每个第一三元组数据对应的向量;根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。2.根据权利要求1所述的方法,其特征在于,所述根据各个第一三元组数据,获得每个第一三元组数据对应的向量包括:根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量;其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量、每个第一三元组数据包括的头实体和尾实体的关系以及关系向量映射模型,获得每个第一三元组数据的头实体和尾实体关系对应的向量;其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的;根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得每个第一三元组数据对应的向量。3.根据权利要求2所述的方法,其特征在于,基于实体的风险相关属性信息和对应的标签训练获得向量映射模型的步骤包括:从贷款客户知识图谱中获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为对应的标签;根据第一初始模型、所述第一预设数量个实体的风险相关属性信息以及对应的标签,训练获得所述向量映射模型。4.根据权利要求2所述的方法,其特征在于,基于实体关系训练数据以及对应的标签训练获得关系向量映射模型的步骤包括:从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据;根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个关系训练三元组数据的头实体对应的向量和尾实体对应的向量;获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,并将各个关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据;根据第二初始模型、所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,训练获得所述关系向量映射模型。5.根据权利要求1所述的方法,其特征在于,基于三元组风险训练数据以及对应的标签训练获得风险预测模型的步骤包括:从贷款客户知识图谱中抽取第二预设数量的三元组数据作为三元组风险训练数据,并
获取每个三元组数据中尾实体对应的风险等级作为每个三元组数据对应的标签;根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量;根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得所述三元组风险训练数据中每个三元组数据对应的向量;根据第二初始模型、所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,训练获得所述风险预测模型。6.根据权利要求1所述的方法,其特征在于,预先建立所述贷款客户知识图谱的步骤包括:基于初始三元组数据构建初始贷款客户知识图谱;其中,所述初始三元组数据是通过贷款相关数据抽取获得的;对所述初始贷款客户知识图谱进行共指消解,获得所述贷款客户知识图谱。7.根据权利要求1至6任一项所述的方法,其特征在于,确定所述目标客户为风险客户的步骤包括:从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据;根据所述目标客户的各个第二三元组数据,获得所述目标客户的子图特征;根据所述目标客户的子图特征以及资金流向异常检测模型,获得所述目标客户的资金流向检测结果;其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的;若获知所述目标客户的资金流向检测结果为资金流向异常,则确定所述目标客户为风险客户。8.根据权利要求7所述的方法,其特征在于,基于资金流向异常检测训练数据以及对应的标签训练获得所述资金流向异常检测模型的步骤包括:从贷款客户知识图谱中获取具有资金流向关系的各个三元组数据;根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图特征,作为所述资金流向异常检测训练数据,并获得所述第三预设数量的子图特征中每个子图特征对应的标签;根据第三初始模型、所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,训练获得所述资金流向异常检测模型。9.一种基于知识图谱的贷款风险识别装置,其特征在于,包括:第一获取模块,用于从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;第一获得模块,用于根据各个第一三元组数据,获得每个第一三元组数据对应的向量...
【专利技术属性】
技术研发人员:陈尚志,朱祖恩,陈浩欣,魏晓聪,邱馥,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。