【技术实现步骤摘要】
欺诈风险预测方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种欺诈风险预测方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]目前,大数据风控中数据的缺失和混乱,撞库、盗账号、盗身份、伪基站等都威胁着各种贷款业务,容易为贷款业务的用户带来经济上的损失。
[0003]为了解决上述问题,在贷款时,需要执行贷前风控。所述贷前风控是金融机构通过各种途径对要贷款的企业或个人进行全面调查和了解,以达到对企业或个人贷款前的风险预测。
[0004]但是当前的贷前风控存在如下问题:1、完全依赖征信体系中客户本身征信信息,由于征信系统存在人员信息不完善的情况,且仅是针对当前的客户自身信息进行预测,信息输入量少,对于上述这些情况欺诈风险预测准确率不高;2、征信系统更新时间长,对于变化情况不能及时支撑预测也导致准确率低。因此当前的贷前风控的欺诈风险预测准确率较低。
技术实现思路
[0005]本专利技术提供一种欺诈风险预测方法、装置及计算机可读存储介质,其主要目的在于解决 ...
【技术保护点】
【技术特征摘要】
1.一种欺诈风险预测方法,其特征在于,所述方法包括:获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。2.如权利要求1所述的欺诈风险预测方法,其特征在于,所述从所述历史客户信息集中提取历史客户信息特征集,包括:对所述历史客户信息集进行分词和词性标注,得到分词及词性标注的结果;根据所述分词及词性标注的结果提取所述分词中的名词及名词短语,并根据所述名词及名词短语,统计得到历史客户信息特征频率集,根据所述历史客户信息特征频率集生成频繁模式树;识别所述频繁模式树中的特征,得到候选历史客户信息特征集;计算所述候选历史客户信息特征集中各个特征的点互信息值,并从所述候选历史客户信息特征集中过滤掉点互信息值小于预设的标准阈值的历史客户信息特征,得到历史客户信息特征集。3.如权利要求2所述的欺诈风险预测方法,其特征在于,所述通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,包括:将所述历史客户信息特征集的分词转化为向量,得到历史客户信息特征向量;从所述历史客户集中逐个选择其中一个客户作为初始历史客户,并从所述历史客户信息特征集中提取所述初始历史客户的历史客户信息特征;将所述初始历史客户的历史客户信息特征转化为对应的向量,得到初始客户信息特征向量;计算所述历史客户信息特征向量与所述初始客户信息特征向量之间的相似度,并根据所述相似度得到所述初始历史客户的相邻客户。4.如权利要求3所述的欺诈风险预测方法,其特征在于,所述根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱,包括:从所述历史客户信息特征集与所述相邻客户信息特征集的分词中提取实体词汇及关系词汇;
将所述实体词汇及所述关系词汇进行分类,并将所述实体词汇及所述关系词汇的分类结果分别存储到实体词汇库和关系词汇库中;基于所述实体词汇库及所述关系词汇库,构建历史客户集的知识图谱。5.如权利要求4所述的欺诈风险预测方法,其特征在于,所述利用预构建的图学习模型对所述历史客户的知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集,包括:利用预构建图学习模型中的第i卷积层对所述知识图谱进行加权求和操作,得到第i节点表征向量,其中,i=1,2,3
…
n;将所述第i节点表征向量通过激活函数传递给第(i+1)卷积层进行加权求和,得到第(i+1)节点表征向量,直至i=n
‑
【专利技术属性】
技术研发人员:何卫萍,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。