信贷欺诈检测方法及其模型的训练方法、装置和服务器制造方法及图纸

技术编号:20969923 阅读:21 留言:0更新日期:2019-04-29 17:26
本发明专利技术提供了一种信贷欺诈检测方法及其模型的训练方法、装置和服务器,其中,信贷欺诈检测模型的训练方法中,通过获取的信贷客户数据确定客户统计特征向量和客户关系图谱;通过获取的信贷客户数据对应的状态标签数据,将客户关系图谱中的节点序列转换为节点标签序列;然后通过skip‑gram算法,将节点标签序列转化为客户关系图谱对应的特征向量;根据统计特征向量和客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。本发明专利技术得到的信贷欺诈检测模型利用了关系图谱网络结构、标签特征和统计特征向量,能够更好的识别客户的欺诈风险,从而提高了风险检测结果的可靠性。

Credit Fraud Detection Method and Its Model Training Method, Device and Server

The invention provides a training method, device and server for a credit fraud detection method and its model, in which, in the training method of a credit fraud detection model, the customer statistical characteristic vector and the customer relationship atlas are determined by acquiring the credit customer data, and the node sequence in the customer relationship atlas is transformed by acquiring the corresponding status label data of the credit customer data. Then, the node label sequence is transformed into the corresponding feature vectors of customer relationship atlas by skip gram algorithm. According to the statistical feature vectors and the feature vectors of customer relationship atlas, the initial model is trained until the number of iterations of training meets the preset threshold of iterations, and the credit fraud detection model is obtained. The credit fraud detection model of the invention utilizes the network structure of the relational atlas, label features and statistical feature vectors, and can better identify the fraud risk of customers, thereby improving the reliability of the risk detection results.

【技术实现步骤摘要】
信贷欺诈检测方法及其模型的训练方法、装置和服务器
本专利技术涉及互联网信贷风控
,尤其是涉及一种信贷欺诈检测方法及其模型的训练方法、装置和服务器。
技术介绍
随着知识图谱和社交网络技术的发展以及在互联网领域中的广泛应用,很多互联网金融机构也开始将关系图谱应用于互联网信贷领域;比如将人物关系做可视化展示,以辅助人工做贷前审批;根据专家经验从图谱中人为的总结几个衍生变量,比如一度关联特征、二度关联特征等,或者从社交网络中提取诸如出度、入度、中心性以及PageRank(网页级别)等基于图论的特征,用于申请评分或者反欺诈;这些方法都基于关系图谱的网络结构进行一定的信息特征抽取,当面对数量庞大的复杂网络的时候,这个过程中必然存在一定的信息缺失,也不能充分表达网络的结构信息,导致仅由关系图谱的网络结构进行互联网信贷检测,得到的结果可靠性较差。
技术实现思路
有鉴于此,本专利技术的目的在于提供信贷欺诈检测方法及其模型的训练方法、装置和服务器,以提高信贷风险检测结果的可靠性。第一方面,本专利技术实施例提供了一种信贷欺诈检测模型的训练方法,该方法包括:获取信贷客户数据和对应的状态标签数据;根据信贷客户数据,确定客户统计特征向量和客户关系图谱;通过信贷客户数据对应的状态标签数据,将信贷客户数据对应的述客户关系图谱中的节点序列转换为节点标签序列;通过skip-gram算法,将节点标签序列转化为客户关系图谱对应的特征向量;根据统计特征向量和客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,上述客户关系图谱包括申请数据、属性数据和相应的客户关系;该客户统计特征向量包括行为统计特征向量、申请统计特征向量和关系统计特征向量,该客户统计特征向量通过下述方式获得:获取信贷客户数据的设备数据、申请数据和社交数据;通过对设备数据的计算,得到行为统计特征向量;通过对申请数据的计算,得到申请统计特征向量;通过对社交数据的计算,得到关系统计特征向量。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,在通过信贷客户数据对应的状态标签数据,将信贷客户数据对应的客户关系图谱中的节点序列转换为节点标签序列的步骤之前,还包括:通过客户关系预设的关系权重和随机游走算法,得到客户关系图谱的节点序列;节点序列包括申请节点和属性节点。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,上述通过信贷客户数据对应的状态标签数据,将信贷客户数据对应的客户关系图谱中的节点序列转换为节点标签序列的步骤包括:将信贷客户数据对应的客户关系图谱中的节点序列中的申请节点转化为信贷客户数据对应的状态标签数据;将信贷客户数据对应的客户关系图谱中的节点序列中的属性节点转化为客户关系图谱中的申请数据、属性数据或者相应的客户关系,以得到节点序列对应的节点标签序列。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,上述通过skip-gram算法,将节点标签序列转化为客户关系图谱对应的特征向量的步骤,包括:将节点标签序列输入至skip-gram模型,输出得到客户关系图谱对应的特征向量。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,上述根据统计特征向量和客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型的步骤包括:将统计特征向量和客户关系图谱的特征向量进行合并;根据合并后的特征向量,采用监督分类算法对初始模型进行训练,当训练的迭代次数满足预设的迭代次数阈值时,得到信贷欺诈检测模型。第二方面,本专利技术实施例还提供一种信贷欺诈检测方法,该方法应用于配置有信贷欺诈检测模型的设备;该信贷欺诈检测模型为第一方面所述方法训练得到的模型;该方法包括:获取待预测的信贷客户数据、对应的状态标签数据和客户关系图谱;将信贷客户数据、状态标签数据和客户关系图谱输入至信贷欺诈检测模型中,得到信贷客户对应的欺诈风险。第三方面,本专利技术实施例还提供一种信贷欺诈检测模型的训练装置,该装置包括:客户数据获取模块,用于获取信贷客户数据和对应的状态标签数据;图谱构建模块,用于根据信贷客户数据,确定客户统计特征向量和客户关系图谱;序列转换模块,用于通过信贷客户数据对应的状态标签数据,将信贷客户数据对应的客户关系图谱中的节点序列转换为节点标签序列;特征向量化模块,用于将通过skip-gram算法,将节点标签序列转化为客户关系图谱对应的特征向量;模型训练模块,用于根据统计特征向量和客户关系图谱的特征向量,对初始模型进行训练,直到训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。第四方面,本专利技术实施例还提供一种信贷欺诈检测装置,该装置应用于配置有信贷欺诈检测模型的设备;该信贷欺诈检测模型为权利要求第一方面所述方法训练得到的模型;该装置包括:数据获取模块,用于获取待预测的信贷客户数据、对应的状态标签数据和客户关系图谱;欺诈风险检测模块,用于将信贷客户数据、对应的状态标签数据和客户关系图谱输入至信贷欺诈检测模型中,得到信贷客户对应的欺诈风险。第五方面,本专利技术实施例还提供一种服务器,该服务器包括存储器和处理器;存储器用于存储支持处理器执行权利要求第一方面所述信贷欺诈检测模型训练方法,或者第二方面所述的信贷欺诈检测方法的程序,处理器被配置为用于执行存储器中存储的程序。本专利技术实施例带来了以下有益效果:本专利技术提供了一种信贷欺诈检测方法及其模型的训练方法、装置和服务器,其中,信贷欺诈检测模型的训练方法中,通过获取的信贷客户数据确定客户统计特征向量和客户关系图谱;通过获取的信贷客户数据对应的状态标签数据,将客户关系图谱中的节点序列转换为节点标签序列;然后通过skip-gram算法,将节点标签序列转化为客户关系图谱对应的特征向量;根据统计特征向量和客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。本专利技术得到的信贷欺诈检测模型充分利用了关系图谱网络结构、标签特征和统计特征向量,该模型能够更好的识别客户的欺诈风险,从而提高了风险检测结果的可靠性。本专利技术的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本专利技术的上述技术即可得知。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施方式,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种信贷欺诈检测模型的训练方法的流程图;图2为本专利技术实施例提供的客户关系图谱的示意图;图3为本专利技术实施例提供的另一种信贷欺诈检测模型的训练方法的流程图;图4为本专利技术实施例提供的一种信贷欺诈检测方法的流程图;图5为本专利技术实施例提供的一种信贷欺诈检测模型的训练装置的结构示本文档来自技高网...

【技术保护点】
1.一种信贷欺诈检测模型的训练方法,其特征在于,所述方法包括:获取信贷客户数据和对应的状态标签数据;根据所述信贷客户数据,确定客户统计特征向量和客户关系图谱;通过所述信贷客户数据对应的所述状态标签数据,将所述信贷客户数据对应的所述客户关系图谱中的节点序列转换为节点标签序列;通过skip‑gram算法,将所述节点标签序列转化为所述客户关系图谱对应的特征向量;根据所述统计特征向量和所述客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。

【技术特征摘要】
1.一种信贷欺诈检测模型的训练方法,其特征在于,所述方法包括:获取信贷客户数据和对应的状态标签数据;根据所述信贷客户数据,确定客户统计特征向量和客户关系图谱;通过所述信贷客户数据对应的所述状态标签数据,将所述信贷客户数据对应的所述客户关系图谱中的节点序列转换为节点标签序列;通过skip-gram算法,将所述节点标签序列转化为所述客户关系图谱对应的特征向量;根据所述统计特征向量和所述客户关系图谱的特征向量,对初始模型进行训练,直至训练的迭代次数满足预设的迭代次数阈值,得到信贷欺诈检测模型。2.根据权利要求1所述的方法,其特征在于,所述客户关系图谱包括申请数据、属性数据和相应的客户关系;所述客户统计特征向量包括行为统计特征向量、申请统计特征向量和关系统计特征向量,所述客户统计特征向量通过下述方式获得:获取所述信贷客户数据的设备数据、申请数据和社交数据;通过对所述设备数据的计算,得到所述行为统计特征向量;通过对所述申请数据的计算,得到所述申请统计特征向量;通过对所述社交数据的计算,得到所述关系统计特征向量。3.根据权利要求1所述的方法,其特征在于,在通过所述信贷客户数据对应的所述状态标签数据,将所述信贷客户数据对应的所述客户关系图谱中的节点序列转换为节点标签序列的步骤之前,还包括:通过客户关系预设的关系权重和随机游走算法,得到所述客户关系图谱的节点序列;所述节点序列包括申请节点和属性节点。4.根据权利要求1所述的方法,其特征在于,所述通过所述信贷客户数据对应的所述状态标签数据,将所述信贷客户数据对应的所述客户关系图谱中的节点序列转换为节点标签序列的步骤包括:将所述信贷客户数据对应的所述客户关系图谱中的节点序列中的申请节点转化为所述信贷客户数据对应的所述状态标签数据;将所述信贷客户数据对应的所述客户关系图谱中的节点序列中的属性节点转化为客户关系图谱中申请数据、属性数据或者相应的客户关系,以得到所述节点序列对应的节点标签序列。5.根据权利要求1所述的方法,其特征在于,所述通过skip-gram算法,将所述节点标签序列转化为所述客户关系图谱对应的特征向量的步骤,包括:将所述节点标签序列输入至skip-gram模型,输出得到所述客户关系图谱对应的特征向量。6.根据权利要求...

【专利技术属性】
技术研发人员:李犇于皓张涧张卓博张杰
申请(专利权)人:阳光财产保险股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1