【技术实现步骤摘要】
一种信用风险评估方法及系统
[0001]本专利技术涉及信用风险评估
,特别是涉及一种信用风险评估方法及系统。
技术介绍
[0002]在机器学习领域,分类任务是一项非常基础的研究内容。通常情况下,二分类任务中的数据集既包含带有正标签的样本也包含带有负标签的样本。然而,现实中负样本的标签往往难以获得,例如,在信用风险评估中,不良的信用可以明确认为是正样本,而未评估的信用风险数据并非一定是负样本(即良好的信用)。近几年来,信用卡欺诈交易正以前所未有的速度增长,并已成为金融部门的一个主要问题。由于这些欺诈行为,商家和金融机构都承受了重大损失。因此,信用风险评估是金融部门在信用借贷审批中不可缺少的一个环节。
[0003]当前已有的信用风险评估方法大部分都是基于有监督机制的,还不完全满足信用风险评估的现实情况。现有的信用风险评估方法,虽然可以得到较好的评估分类效果,但现实生活中信用风险数据往往存在负样本采集困难、采集成本昂贵等问题,且数据往往不可分,这给建立一个鲁棒的分类器带来极大的困难。因此,如何提高信用风险评估效果,是
【技术保护点】
【技术特征摘要】
1.一种信用风险评估方法,其特征在于,包括:获取信用风险评估数据和当前投影矩阵;所述信用风险评估数据包括单类信用风险数据和无标签信用风险数据;所述单类信用风险数据包括多个正样本数据,所述无标签信用风险数据包括多个无标签样本数据;所述当前投影矩阵为对所述信用风险评估数据进行线性判别分析后得到;根据所述信用风险评估数据和所述当前投影矩阵,以最小化误分类经验风险为目标,确定分类器;采用所述分类器对所述无标签信用风险数据进行分类,对所述无标签样本数据分配伪标签,得到伪标签数据;对所述伪标签数据和所述正样本数据进行线性判别分析,得到更新后的投影矩阵;判断是否满足迭代结束条件;若满足,则输出所述分类器和所述更新后的投影矩阵;若不满足,则将所述更新后的投影矩阵作为当前投影矩阵,然后返回步骤“根据所述信用风险评估数据和所述当前投影矩阵,以最小化误分类风险为目标,确定分类器”;根据所述分类器和所述更新后的投影矩阵对所述信用风险评估数据进行信用风险评估,得到信用风险评估结果。2.根据权利要求1所述的信用风险评估方法,其特征在于,在获取信用风险评估数据,之后还包括:对所述信用风险数据进行归一化处理,得到归一化后的信用风险评估数据。3.根据权利要求1所述的信用风险评估方法,其特征在于,所述根据所述信用风险评估数据和所述当前投影矩阵,以最小化误分类经验风险为目标,确定分类器,具体包括:根据所述信用风险评估数据和所述当前投影矩阵,采用如下公式确定分类器:式中,为误分类经验风险,f为分类器,f(
·
)为分类器输出结果,π为正类的先验概率,为正样本数据,为无标签样本数据,l(
·
)为损失函数,λ为权衡参数,n
p
为正样本数量,n
u
为无标签样本数量,i为个数,R为投影矩阵。4.根据权利要求1所述的信用风险评估方法,其特征在于,所述对所述伪标签数据和所述正样本数据进行线性判别分析,得到更新后的投影矩阵,具体包括:对所述伪标签数据和所述正样本数据采用如下公式进行线性判别分析,得到更新后的投影矩阵:其中,S
b
=(μ
p
‑
μ
n
)(μ
p
‑
μ
n
)
T
式中,R为投影矩阵,S
b
为类内散度,S
w
为类间散度,μ
p
为正样本数据的均值向量,μ
n
为负样本数据的均值向量,x为样本,X
p
为正样本集,X
n
为负样本集;正样本集为存在信用风险的数据,负样本集为不存在信用风险的数据。5.根据权利要求1所述的信用风险评估方法,其特征在于,所述根据所述分类器和所述更新后的投影矩阵对所述信用风险评估数据进行信用风险评估,得到信用风险评估结果,具体包括:根据所述更新后的投影矩阵和所述信用风险评估数据,采用所述分类器进行信用风险分类,得到信用风...
【专利技术属性】
技术研发人员:陈秀华,宫辰,
申请(专利权)人:南京浩翔基础软件研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。