差分隐私下基于SVM的信用违约预测方法技术

技术编号：26845860 阅读：23 留言：0更新日期：2020-12-25 13:08

本发明专利技术公开了信用违约技术领域的差分隐私下基于SVM的信用违约预测方法，包括如下步骤：S1：数据预处理；S2：变量选择；S3：根据差分隐私串行组合性质，设计差分隐私下加权SVM优化模型，本发明专利技术为数据不平衡下的差分隐私SVM学习问题提供了有效的解决方案，该解决方案能够针对性地解决使用差分隐私SVM学习预测客户违约时面临的数据不平衡问题，适用于包括信用卡违约预测在内的存在数据不平衡的应用场景，如灾害预测，医疗诊断等领域也适用于本发明专利技术的技术方案。

全部详细技术资料下载

【技术实现步骤摘要】
差分隐私下基于SVM的信用违约预测方法
本专利技术涉及信用违约
，具体为差分隐私下基于SVM的信用违约预测方法。
技术介绍
随着社会经济的快速发展，越来越多人使用信用卡实现超前消费。在人们享受信用卡带来的消费便利的同时，越来越多的信用卡债务问题也随之产生。一部分人由于无法及时偿还信用卡债务导致信用卡违约，使得金融机构和消费者遭受巨大经济损失，严重破坏了现有金融秩序，打击了消费者金融信息。如何有效识别潜在的信用卡违约客户，减少信用卡违约的现象是金融机构进行风险控制和管理过程中面临的巨大挑战。作为一种经典的机器学习方法，SVM学习靠着强大的数据拟合能力备受科研人员青睐。该技术基于坚实的数学理论基础，能够高效、稳定地完成学习过程，并且训练后的模型具有良好的鲁棒性。为减少信用卡金融交易的损失和不确定性，本专利技术将采用SVM学习预测潜在的信用卡违约客户。对于任何金融机构而言，保护客户个人隐私安全是其最基本的义务。然而，在使用机器学习建立金融预测模型的过程中需要涉及客户数据的使用，存在客户个人隐私泄露的风险，尤其是当预测模型被提供给不被信任的第三方时。如图1所示，银行A利用自己客户的信息训练了预测模型，然后将该模型提供给第三方机构B用于帮助他们预测自己的客户是否具有违约倾向。此时，若第三方机构B存在恶意窃取银行A客户隐私的动机，则可能导致银行A的客户隐私泄露。为了保护个人隐私，DWork等人提出了差分隐私保护技术，该技术基于严格的数学分析提供强大的个人隐私保护，保证了无论攻击者具有任何背景知识，都难以有效

【技术保护点】
1.差分隐私下基于SVM的信用违约预测方法，包括如下步骤：/nS1：数据预处理：通过归一化方法将隐私数据库D的数据映射到区间[-1，1]内，所述隐私数据库D的数据类型分为代表类别的离散型变量和代表数量的连续型变量；/nS2：变量选择：将S1处理后的数据进行变量贡献度分析，选用贡献度最大的k

【技术特征摘要】
1.差分隐私下基于SVM的信用违约预测方法，包括如下步骤：
S1：数据预处理：通过归一化方法将隐私数据库D的数据映射到区间[-1，1]内，所述隐私数据库D的数据类型分为代表类别的离散型变量和代表数量的连续型变量；
S2：变量选择：将S1处理后的数据进行变量贡献度分析，选用贡献度最大的kDiscrete个离散型变量和kContinuity个连续型变量；
S3：建立模型：根据差分隐私串行组合性质，设计差分隐私下加权SVM优化模型。

2.根据权利要求1所述的差分隐私下基于SVM的信用违约预测方法，其特征在于：在所述步骤S1中，对于所述离散型变量，通过数据平移、缩放的方法将数值均匀地映射到[0，1]之间；对于所述连续型变量，按照一定比例缩放，然后采用数值截断的方法将数值进行映射。

3.根据权利要求1所述的差分隐私下基于SVM的信用违约预测方法，其特征在于：在所述步骤S2中，
对于所述离散型变量，贡献度最大的kDiscrete个离散型变量采用信息增益比衡量，信息增益比IGR(A)的表达式如下：

其中，EntD(A)表示对于变量A关于隐私数据库D的信息熵，EntD(Y)表示对于变量Y关于隐私数据库D的信息熵，DA＝ν表示由D中满足筛选条件A＝ν的样例所构成的子集，
对于所述连续型变量，贡献度最大的kContinuity个连续型变量采用Jaccard距离衡量，Jaccard距离JacDis的表达式如下：

其中，S1表示被标记为1的分布曲线所围成的曲面面积，S-1表示被标记为-1的分布曲线所围成的曲面面积。

4.根据权利要求3所述的差分隐私下基于SVM的信用违约预测方法，其特征在于：对于所述连续型变量，利用了核概率密度估...

【专利技术属性】
技术研发人员：刘西蒙，蔡剑平，李家印，李小燕，郭文忠，
申请(专利权)人：刘西蒙，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人