基于多维数据预测用户的违约概率的方法及设备技术

技术编号：41199683 阅读：4 留言：0更新日期：2024-05-07 22:26

本发明专利技术提供了一种基于多维数据预测用户的违约概率的方法及设备，该方法包括：使用映射函数将用户的不同的多维数据映射至共识空间，以得到共同的共识空间表达，利用共识空间表达构建全局结构表达式；使用投影矩阵将用户的不同的多维数据投影至低维空间，以得到投影结果，基于哈希码矩阵和投影结果得到目标函数；融合投影结果的不同信息之间的相似性以学习相似度矩阵和投影矩阵，以得到优化函数；将全局结构表达式、目标函数、优化函数相加得到优化目标函数，以基于优化目标函数对用户身份进行识别；在用户身份识别通过的情况下，将用户的不同的多维数据输入至生成对抗网络中，以得到用户的违约概率。因此，解决了便于预测用户违约概率的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理领域，具体而言，涉及一种基于多维数据预测用户的违约概率的方法及设备。

技术介绍

1、多模态语义检索是一类研究热点问题。对于大多数散列方法，使用二进制矩阵来表示相关程度，无法捕捉到多维数据更深层次的语义信息。

2、例如，典型关联分析(cca)是最常用的挖掘数据关联关系的算法之一。比如两组数据，第一组是人身高和体重的数据，第二组是对应的跑步能力和跳远能力的数据。cca可以帮助分析这个问题。相关技术中主要采用cca识别用户的信息。例如，对于两组线性数据，第一组数据是用户的身高和体重的数据，第二组数据是对应的跑步能力和跳远能力的数据。则可以使用cca分析两组数据的相关系数，以判断第一组数据和第二组数据之间的相关性。

3、但是，cca算法依赖于数据的线性表示，当数据无法线性表示时，cca就无法使用。即：当用户信息数据为非线性关系时，则无法使用cca识别用户的信息，进而便难以对用户违约的概率进行预测。

技术实现思路

1、本专利技术实施例提供了一种基于多维数据预测用户的违约概率的方法及设备，以至少解决了相关技术中当用户信息数据为非线性关系时，则无法使用cca识别用户的信息，进而便难以对用户违约的概率进行预测的问题。

2、根据本专利技术的一个实施例，提供了一种基于多维数据预测用户的违约概率的方法，包括：

3、使用映射函数将用户的不同的多维数据映射至共识空间，以得到共同的共识空间表达，利用所述共识空间表达构建全局结构表达式；>

4、使用投影矩阵将用户的不同的多维数据投影至低维空间，以得到投影结果，基于哈希码矩阵和所述投影结果得到目标函数；

5、融合所述投影结果的不同信息之间的相似性以学习相似度矩阵和所述投影矩阵，以得到优化函数，其中，所述相似度矩阵用于衡量所述投影结果的不同信息之间的相关程度；

6、将所述全局结构表达式、所述目标函数、所述优化函数相加得到优化目标函数，以基于所述优化目标函数对用户身份进行识别；

7、在所述用户身份识别通过的情况下，将用户的不同的多维数据输入至生成对抗网络中，以得到用户的违约概率。

8、可选地，所述全局结构表达式为：

9、

10、其中，为用户的不同的多维数据对应的向量，包括第一向量和第二向量γiv为权重系数，γiv包括第一权重系数γi1和第二权重系数γi2；φv为映射函数，φv包括第一映射函数φ1和第二映射函数φ2，φ1用于将第一向量映射至共识空间，φ2用于将第二向量映射至共识空间；ui为共识空间的向量；v为共识空间的维度；qi为第一矩阵；ci为第二矩阵；ev+1为单位向量；iv+1为单位矩阵。

11、可选地，还包括基于所述用户的不同的多维数据的分量对所述匹配结果进行求和处理，所述求和处理的表达式为：

12、

13、其中，n为所述用户的不同的多维数据的分量，1≤i≤n；ki为关于第一矩阵qi的变化矩阵。

14、可选地，所述目标函数的表达式为：

15、

16、st.b∈{-1，1}l×n

17、其中，b为哈希码矩阵，b＝{b1，b2，...bi...，bn}∈rl×n；pv为投影矩阵，包括第一投影矩阵p1和第二投影矩阵p2，p1∈rl×m，p2∈rl×m，第一投影矩阵p1用于将投影至低维空间，第二投影矩阵p2用于将投影至低维空间；μv为惩罚参数，包括第一惩罚参数μ1和第二惩罚参数μ2；βv为正则化参数，包括第一正则化参数β1和第二正则化参数β2。

18、可选地，还包括使用相似度矩阵衡量用户的不同的多维数据之间的相关程度，衡量相关程度的表达式为：

19、

20、st.p1tp1＝i，p2tp2＝i，η1+η2＝1，η1，η2≥0；

21、

22、其中，sij(v)为相似度矩阵，包括第一相似度矩阵sij(1)和第二相似度矩阵sij(2)；ηv为自适应学习的权重参数，包括第一权重参数η1和第二权重参数η2；λv为平衡相似度矩阵sij(v)的正则化参数，包括第一正则化参数η1和第二正则化参数η2。

23、可选地，还包括对所述衡量相关程度的表达式进行降噪处理，所述降噪处理的表达式包括：

24、

25、st.p1tp1＝i，p2tp2＝i，η1+η2＝1，η1，η2≥0；

26、

27、其中，r1≥0，r2≥0。

28、可选地，所述优化目标函数的表达式包括：

29、

30、

31、

32、可选地，还包括使用最优值最大化所述生成对抗网络得到的似然函数，所述最大化的表达式包括：

33、

34、

35、g*＝argming maxd v(g，t)；

36、

37、其中，x＝(x1，x2)；l为似然函数，v为最大似然；g为生成对抗网络的生成器；d为生成对抗网络的判别器；θ为生成器g的参数；θ*为生成对抗网络的最优化参数；v为生成对抗网络的损失函数。

38、根据本专利技术的又一个实施例，还提供了一种计算机可读的存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被处理器运行时执行上述任一项方法实施例中的步骤。

39、根据本专利技术的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

40、通过本专利技术，通过引入映射函数、投影矩阵和相似度矩阵等技术，能够将用户的多维数据映射到共识空间并进行投影，从而克服了cca算法对数据线性表示的要求，能够有效地处理非线性关系的用户信息数据，实现了对用户违约概率的预测。

本文档来自技高网...

【技术保护点】

1.一种基于多维数据预测用户的违约概率的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述全局结构表达式为：

3.根据权利要求2述的方法，其特征在于，还包括基于所述用户的不同的多维数据的分量对所述匹配结果进行求和处理，所述求和处理的表达式为：

4.根据权利要求1所述的方法，其特征在于，所述目标函数的表达式为：

5.根据权利要求1所述的方法，其特征在于，还包括使用相似度矩阵衡量用户的不同的多维数据之间的相关程度，衡量相关程度的表达式为：

6.根据权利要求5所述的方法，其特征在于，还包括对所述衡量相关程度的表达式进行降噪处理，所述降噪处理的表达式包括：

7.根据权利要求1所述的方法，其特征在于，所述优化目标函数的表达式包括：

8.根据权利要求1所述的方法，其特征在于，还包括使用最优值最大化所述生成对抗网络得到的似然函数，所述最大化的表达式包括：

9.一种计算机可读的存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被处理器运行时执行所述权利要求1至8任一项中所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种基于多维数据预测用户的违约概率的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述全局结构表达式为：

3.根据权利要求2述的方法，其特征在于，还包括基于所述用户的不同的多维数据的分量对所述匹配结果进行求和处理，所述求和处理的表达式为：

4.根据权利要求1所述的方法，其特征在于，所述目标函数的表达式为：

5.根据权利要求1所述的方法，其特征在于，还包括使用相似度矩阵衡量用户的不同的多维数据之间的相关程度，衡量相关程度的表达式为：

6.根据权利要求5所述的方法，其特征在于，还包括对所述衡量相关程度的表达式进...

【专利技术属性】
技术研发人员：孙圣姿，苗森，
申请(专利权)人：中国光大银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人