金融业务的风险评估方法、风控服务端及存储介质技术

技术编号:20969885 阅读:16 留言:0更新日期:2019-04-29 17:26
本发明专利技术公开了一种金融业务的风险评估方法、风控服务端及存储介质,该方法包括:获取预设数量的样本用户的风险评估样本数据;通过K‑means算法对风险评估样本数据进行聚类分析,得到K个样本类别以及样本类别对应的样本数据;在接收到金融业务办理请求之前,获取用户的风险评估数据,并根据风险评估数据以及样本类别,确定风险评估数据所属的样本类别;将风险评估数据加入确定的样本类别对应的样本数据中,以形成新的样本数据;通过决策树算法对新的样本数据进行计算,以推导出决策条件;根据决策条件更新决策树模型,并通过更新后的决策树模型评估所述金融业务的风险概率。本发明专利技术提高了风控模型自我学习能力,提升了风控评估的准确度。

Risk Assessment Method, Wind Control Service and Storage Media in Financial Business

The invention discloses a risk assessment method, a wind control service end and a storage medium for financial business. The method includes: acquiring a preset number of sample data for risk assessment of sample users; clustering analysis of sample data for risk assessment through K_means algorithm, obtaining sample data corresponding to K sample categories and sample categories; before receiving a request for financial business processing; To obtain the user's risk assessment data, and determine the sample category of the risk assessment data according to the risk assessment data and the sample category; to add the risk assessment data to the sample data corresponding to the determined sample category to form the new sample data; to calculate the new sample data through the decision tree algorithm to derive the decision conditions; to update the decision conditions according to the decision conditions The decision tree model is used to evaluate the risk probability of the financial business through the updated decision tree model. The invention improves the self-learning ability of the air control model and the accuracy of the air control evaluation.

【技术实现步骤摘要】
金融业务的风险评估方法、风控服务端及存储介质
本专利技术涉及风控领域,尤其涉及金融业务的风险评估方法、风控服务端及计算机可读存储介质。
技术介绍
风险控制,简称风控,是指风险管理者采取各种方法和措施,消灭或减少风险事件发生的可能性,以达到减少风险事件发生时造成的损失的目的。风险控制的首要步骤即是对风险事件发生的可能性进行评估。传统风控在对风险事件发生的可能性进行评估时,主要是基于已经设定好的各项业务规则进行判定。例如,用户被列入黑名单属于直接认定为风险事件发生率为100%的业务规则,假设用户A被列入黑名单,那么传统风控评估系统将认为该用户A对应的风险事件的发生率为100%。但随着欺诈手段的层出不穷,基于已经设定好的各项业务规则进行的传统风控模型由于自我学习不够,已经不能应对各种新的欺诈手段,进而使得风控评估的结果不准确。
技术实现思路
本专利技术的主要目的在于提供一种金融业务的风险评估方法、风控服务端及计算机可读存储介质,旨在解决因传统风控模型自我学习能力不够导致风控评估结果不准确的问题。为实现上述目的,本专利技术提供一种金融业务的风险评估方法,包括步骤:获取预设数量的样本用户对应的风险评估样本数据;通过K-means算法对所述风险评估样本数据进行聚类分析,得到K个样本类别以及每个所述样本类别分别对应的样本数据,其中K大于或等于2;在接收到用户发送的金融业务办理请求之前,获取所述用户对应的风险评估数据,并根据所述风险评估数据以及所述K个样本类别,确定所述风险评估数据所属的样本类别;将所述风险评估数据加入确定的样本类别所对应的样本数据中,以形成新的样本数据;通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件;根据所述决策条件更新所述决策树模型,并通过更新后的决策树模型评估所述金融业务的风险概率。可选地,所述通过K-means算法对所述风险评估样本数据进行聚类分析,得到K个样本类别以及每个所述样本类别分别对应的样本数据,其中K大于或等于2的步骤包括:通过输入基因表达矩阵构建所述K-means算法的对象集,所述对象集由所有所述风险评估样本数据对应的数据点组成;从所述对象集中选择K个所述数据点,其中K大于或等于2,并在所述对象集中以所述K个数据点为聚类中心分别建立数据簇;执行对聚类中心以及数据簇的迭代操作,其中所述迭代操作的步骤包括:将每个数据点调整至该数据点距离最近的聚类中心所在的数据簇中;根据调整后的每个数据簇中所有的数据点重新确定聚类中心;每次执行完所述迭代操作后,判断所述迭代中止条件是否成立,其中,所述迭代中止条件包括:相邻两次迭代操作中数据点至聚类中心的距离平方和的差小于预设误差阈值,或者,迭代操作的次数达到预设次数阈值;当所述迭代中止条件成立时,将最新确定的所有聚类中心作为样本类别,将最新确定的每个聚类中心所在数据簇作为每个样本类别分别对应的样本数据;当所述迭代中止条件不成立时,返回继续执行迭代操作。可选地,所述将每个数据点调整至该数据点距离最近的聚类中心所在数据簇中的步骤包括:获取每个数据点至所有聚类中心的距离;其中,所述获取每个数据点至所有聚类中心的距离的步骤包括:通过计算每个数据点至所有聚类中心的距离;或者,通过d12=|x1-x2|+|y1-y2|计算每个数据点至所有聚类中心的距离;或者,通过d12=max(|x1-x2|,|y1-y2|)计算每个数据点至所有聚类中心的距离;其中,聚类中心的坐标为(x1,y1),每个数据点的坐标为(x2,y2),d12为数据点至聚类中心的距离;根据每个数据点至所有聚类中心的距离,将每个数据点调整至该数据点距离最近的聚类中心所在的数据簇中。可选地,所述根据所述风险评估数据以及所述K个样本类别,确定所述风险评估数据所属的样本类别的步骤包括:在所述输入基因表达矩阵中,计算所述风险评估数据对应的数据点与每个所述样本类别的距离;根据所述风险评估数据对应的数据点与每个所述样本类别间的距离,将风险评估数据归类至距离最短的所述样本类别中。可选地,所述决策树算法包括ID3算法;所述数据点具有多种属性;所述通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件的步骤包括:按照所述决策树模型的层级从低到高的顺序依次选择所述层级;每次选择完决策树模型的层级后,通过计算分别用每种属性划分所述新的样本数据时每种属性对应的信息增益,其中D为所述新的样本数据,a为当前选择的属性,V为当前选择的属性a划分所述新的样本数据D时所划分的类别数,Gain为信息增益,Ent为所述新的样本数据D进行分类时的熵;选择信息增益最高的属性作为该层级的决策条件,并根据选择的决策条件对所述新的样本数据进行分类,以得到更新后的所述新的样本数据;记录所述决策树模型的层级,并判断所述决策树模型的层级是否达到预设深度阈值;当所述决策树模型的层级达到预设深度阈值时,停止选择层级,并输出所有选择的层级对应的决策条件;当所述决策树模型的层级未达到预设深度阈值时,从所有属性中除去当前选择的作为决策条件的属性,并继续执行选择所述层级的步骤。可选地,所述决策树算法包括C4.5算法;所述数据点具有多种属性;所述通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件的步骤包括:按照所述决策树模型的层级从低到高的顺序依次选择所述层级;每次选择完决策树模型的层级后,通过计算分别用每种属性划分所述新的样本数据时每种属性对应的信息增益率,其中D为所述新的样本数据,a为当前选择的属性,V为当前选择的属性a划分所述新的样本数据D时所划分的类别数,Gain为信息增益,GainRatio为信息增益率;选择信息增益率最高的属性作为该层级的决策条件,并根据选择的决策条件对所述新的样本数据进行分类,以得到更新后的所述新的样本数据;记录所述决策树模型的层级,并判断所述决策树模型的层级是否达到预设深度阈值;当所述决策树模型的层级达到预设深度阈值时,停止选择层级,并输出所有选择的层级对应的决策条件;当所述决策树模型的层级未达到预设深度阈值时,从所有属性中除去当前选择的作为决策条件的属性,并继续执行选择所述层级的步骤。可选地,所述决策树算法包括CART算法;所述数据点具有多种属性;所述通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件的步骤包括:按照所述决策树模型的层级从低到高的顺序依次选择所述层级;每次选择完决策树模型的层级后,通过计算分别用每种属性划分所述新的样本数据时每种属性对应的基尼系数,其中D为所述新的样本数据,a为当前选择的属性,Gini为基尼值,GiniInder为基尼系数;选择基尼系数最小的属性作为该层级的决策条件,并根据选择的决策条件对所述新的样本数据进行分类,以得到更新后的所述新的样本数据;记录所述决策树模型的层级,并判断所述决策树模型的层级是否达到预设深度阈值;当所述决策树模型的层级达到预设深度阈值时,停止选择层级,并输出所有选择的层级对应的决策条件;当所述决策树模型的层级未达到预设深度阈值时,从所有属性中除去当前选择的作为决策条件的属性,并继续执行选择所述层级的步骤。此外,为实现上述目的,本专利技术还提供一种风控服务端,包括:获取模块,用于获取预设数量的样本用户对应本文档来自技高网...

【技术保护点】
1.一种金融业务的风险评估方法,其特征在于,包括步骤:获取预设数量的样本用户对应的风险评估样本数据;通过K‑means算法对所述风险评估样本数据进行聚类分析,得到K个样本类别以及每个所述样本类别分别对应的样本数据,其中K大于或等于2;在接收到用户发送的金融业务办理请求之前,获取所述用户对应的风险评估数据,并根据所述风险评估数据以及所述K个样本类别,确定所述风险评估数据所属的样本类别;将所述风险评估数据加入确定的样本类别所对应的样本数据中,以形成新的样本数据;通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件;根据所述决策条件更新所述决策树模型,并通过更新后的决策树模型评估所述金融业务的风险概率。

【技术特征摘要】
1.一种金融业务的风险评估方法,其特征在于,包括步骤:获取预设数量的样本用户对应的风险评估样本数据;通过K-means算法对所述风险评估样本数据进行聚类分析,得到K个样本类别以及每个所述样本类别分别对应的样本数据,其中K大于或等于2;在接收到用户发送的金融业务办理请求之前,获取所述用户对应的风险评估数据,并根据所述风险评估数据以及所述K个样本类别,确定所述风险评估数据所属的样本类别;将所述风险评估数据加入确定的样本类别所对应的样本数据中,以形成新的样本数据;通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件;根据所述决策条件更新所述决策树模型,并通过更新后的决策树模型评估所述金融业务的风险概率。2.根据权利要求1所述的金融业务的风险评估方法,其特征在于,所述通过K-means算法对所述风险评估样本数据进行聚类分析,得到K个样本类别以及每个所述样本类别分别对应的样本数据,其中K大于或等于2的步骤包括:通过输入基因表达矩阵构建所述K-means算法的对象集,所述对象集由所有所述风险评估样本数据对应的数据点组成;从所述对象集中选择K个所述数据点,其中K大于或等于2,并在所述对象集中以所述K个数据点为聚类中心分别建立数据簇;执行对聚类中心以及数据簇的迭代操作,其中所述迭代操作的步骤包括:将每个数据点调整至该数据点距离最近的聚类中心所在的数据簇中;根据调整后的每个数据簇中所有的数据点重新确定聚类中心;每次执行完所述迭代操作后,判断所述迭代中止条件是否成立,其中,所述迭代中止条件包括:相邻两次迭代操作中数据点至聚类中心的距离平方和的差小于预设误差阈值,或者,迭代操作的次数达到预设次数阈值;当所述迭代中止条件成立时,将最新确定的所有聚类中心作为样本类别,将最新确定的每个聚类中心所在数据簇作为每个样本类别分别对应的样本数据;当所述迭代中止条件不成立时,返回继续执行迭代操作。3.根据权利要求2所述的金融业务的风险评估方法,其特征在于,所述将每个数据点调整至该数据点距离最近的聚类中心所在数据簇中的步骤包括:获取每个数据点至所有聚类中心的距离;其中,所述获取每个数据点至所有聚类中心的距离的步骤包括:通过计算每个数据点至所有聚类中心的距离;或者,通过d12=|x1-x2|+|y1-y2|计算每个数据点至所有聚类中心的距离;或者,通过d12=max(|x1-x2|,|y1-y2|)计算每个数据点至所有聚类中心的距离;其中,聚类中心的坐标为(x1,y1),每个数据点的坐标为(x2,y2),d12为数据点至聚类中心的距离;根据每个数据点至所有聚类中心的距离,将每个数据点调整至该数据点距离最近的聚类中心所在的数据簇中。4.根据权利要求2所述的金融业务的风险评估方法,其特征在于,所述根据所述风险评估数据以及所述K个样本类别,确定所述风险评估数据所属的样本类别的步骤包括:在所述输入基因表达矩阵中,计算所述风险评估数据对应的数据点与每个所述样本类别的距离;根据所述风险评估数据对应的数据点与每个所述样本类别间的距离,将风险评估数据归类至距离最短的所述样本类别中。5.根据权利要求2所述的金融业务的风险评估方法,其特征在于,所述决策树算法包括ID3算法;所述数据点具有多种属性;所述通过决策树算法对所述新的样本数据进行计算,以推导出决策树模型中的决策条件的步骤包括:按照所述决策树模型的层级从低到高的顺序依次选择所述层级;每次选择完决策树模型的层级后,通过计算分别用每种属性划分所述新的样本数据时每种属性对应的信息增益,其中D为所述新的样本数据,a为当前选择的属性,V为当前选择的属性a划分所述新的样本数据D时所划分的类别数,Gain为信息增益,Ent为所述新的样本数据D进行分类时的熵;选择信息增益最高的属性作为该层级的决策条件,并根据选择的决策条件对所述新的样本数据进行分类,...

【专利技术属性】
技术研发人员:廖明宇彭迪
申请(专利权)人:深圳平安财富宝投资咨询有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1