【技术实现步骤摘要】
风险评分模型中规则阈值确定方法及装置
[0001]本专利技术涉及大数据
,尤其涉及风险评分模型中规则阈值确定方法及装置
。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文
。
此处的描述不因为包括在本部分中就承认是现有技术
。
[0003]现有风险评分模型的规则阈值,多为业务人员凭借风险经验进行确认,存在一定的主观性
。
同时,不同业务人员对某一规则的阈值的确定也会存在争议
。
[0004]现有风险评分模型设计的过程如下:
[0005]需求收集与分析:对于收集的案例进行识别点分析,归纳可疑行为类型及特征
。
[0006]模型设计:根据可疑特征细化模型规则及指标;设置各规则阈值及模型阈值
。
[0007]模型开发及测试:开发过程中进行多轮模型测试与调整,确保模型符合设计标准和期望;对输出结果按一定比例提取样本下发分行进行业务验证,结合模型告警量及可疑确认率评估模型的有效性
。
[0008]上述过程中,主要为专家凭借业务经验,判断各规则在本模型中的风险权重并进行赋值,存在一定的主观性和个体差异性,确定的阈值并不准确
。
技术实现思路
[0009]本专利技术实施例提供一种风险评分模型中规则阈值确定方法,用以通过量化的方式,准确确定风险评分模型中规则阈值,避免了完全通过人工方式赋分确定阈值的主观性及差异性,该方法包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.
一种风险评分模型中规则阈值确定方法,其特征在于,包括:获得多个数据范围内的历史客户数据;获得风险评分模型中每条规则初始设置的阈值,所述风险评分模型用于基于每条规则及对应阈值,筛选出每条规则对应的风险客户数据;对每个数据范围,将该数据范围内的历史客户数据输入风险评分模型,筛选出该数据范围内每条规则对应的风险客户数据;根据每个数据范围内的历史客户数据和每条规则对应的风险客户数据,计算每个数据范围内每条规则对应的确认风险客户占比;根据每个数据范围内,每条规则对应的确认风险客户占比,确定每个数据范围内每条规则的分值;对每条规则,根据所有数据范围内该条规则的分值,确定风险评分模型中该条规则的阈值
。2.
如权利要求1所述的方法,其特征在于,根据每个数据范围内的历史客户数据和每条规则对应的风险客户数据,计算每个数据范围内每条规则对应的确认风险客户占比,包括:对每个数据范围,根据该数据范围内的历史客户数据和和每条规则对应的风险客户数据,获得历史客户的数量
、
风险客户的数量;计算历史客户的数量与风险客户的数量的第一比值;确定第一比值为每条规则对应的确认风险客户占比
。3.
如权利要求2所述的方法,其特征在于,还包括:根据每条规则对应的风险客户数据,获得每条规则对应的风险客户的可疑交易量
、
风险客户的历史所有交易量;计算风险客户的可疑交易量
、
风险客户的历史所有交易量的第二比值;确定第一比值的权重和第二比值的权重;根据第一比值及对应权重
、
第二比值及对应权重,计算每条规则对应的确认风险客户占比
。4.
如权利要求3所述的方法,其特征在于,还包括:根据历史客户数据和风险客户数据,获得风险客户的可疑特征数量和历史客户的所有可疑特征数量;计算风险客户的可疑特征数量和历史客户的所有可疑特征数量的第三比值;确定第一比值的权重
、
第二比值的权重和第三比值的权重;根据第一比值及对应权重
、
第二比值及对应权重
、
第三比值及对应权重,计算每条规则对应的确认风险客户占比
。5.
如权利要求4所述的方法,其特征在于,根据每个数据范围内,每条规则对应的确认风险客户占比,确定每个数据范围内每条规则的分值,包括:对每个数据范围内的每条规则,获得该条规则所在风险识别点类别中所有规则的确认风险客户占比的总和;其中,风险评分模型包括多个风险识别点类别,每个风险识别点类别对应多条规则;根据该条规则的确认风险客户占比
、
所述总和
、
单条规则预设总值,确定每个数据范围内每条规则的分值
。
...
【专利技术属性】
技术研发人员:段若男,俞泱,马堃,张思聪,宋晓晖,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。