一种基于组合赋权的用户业务安全综合风险的评估方法技术

技术编号:24758626 阅读:21 留言:0更新日期:2020-07-04 09:43
本发明专利技术公开了一种基于组合赋权的用户业务安全综合风险的评估方法,要解决的是现有用户风险行为难以全流程反映的问题。本发明专利技术的具体步骤如下:步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化;步骤二,风险指标筛选:从区分度和相似度两个方面进行风险指标筛选;步骤三,计算单一方法赋权的权重系数;步骤四,求解多种赋权方法的组合赋权权重,计算出各用户的综合风险分值。本发明专利技术提出了指标和模型相结合的权重生成方法,本发明专利技术的用户总体风险评分方法具有风险识别能力,且评分能够将风险客户和非风险客户显著地区分开,安全风险等级评估体系更加直观;本发明专利技术的方法在不同行业的业务环境中具有一定的通用性。

A comprehensive risk assessment method for user business security based on combination weighting

【技术实现步骤摘要】
一种基于组合赋权的用户业务安全综合风险的评估方法
本专利技术涉及计算机数据安全领域,具体是一种基于组合赋权的用户业务安全综合风险的评估方法。
技术介绍
近年来,大数据风控、智能风控等技术广为应用。随着C端用户规模的不断扩大,防范薅羊毛、盗刷、盗号等业务风险逐渐成为企业安全建设中不可或缺的一个模块。有效的业务安全风险防护和反欺诈措施,既可以避免企业营销成本的浪费,又保障了企业的市场策略能够更精准的触及到真实用户,一定程度上维护着企业的品牌效益。目前多数的大数据风控系统中,用户行为分析、基于设备和环境的异常分析、用户画像等技术都能够实现从不同的维度对用户的风险系数进行刻画。此外,金融风控行业还有基于用户评分卡技术,得到用户的综合信用评分,服务于贷前、贷中、贷后的用户信用评级。现有的用户风险评级技术主要是基于机器学习模型,构建不同场景的用户评分卡。例如,反欺诈评分卡、行为评分卡、催收评分卡等。这种分场景的评分卡模型忽略了不同业务场景之间的关系。具体而言,在各个环节风险都较高的用户,相比于仅在单一环节风险高的用户,其总体风险更高。现有的指标统计方法得到的风险综合评分通常不能将风险用户和正常用户的评价结果最大程度地划分开,导致两者的信用得分产生大量重叠、对风险的区分能力低。此外,对于业务场景较多的企业,只能通过罗列重要场景的用户风险获取多个风险标签,因此也难以反映全流程业务中用户风险行为的分布情况。
技术实现思路
本专利技术实施例的目的在于提供一种基于组合赋权的用户业务安全综合风险的评估方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术实施例提供如下技术方案:一种基于组合赋权的用户业务安全综合风险的评估方法,具体步骤如下:步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化,形成初步的指标变量;步骤二,风险指标筛选:从区分度和相似度两个方面进行风险指标筛选;步骤三,计算单一方法赋权的权重系数:采用主观赋权法和客观赋权法分别生成权重系数;步骤四,求解多种赋权方法的组合赋权权重,计算出各用户的综合风险分值。要使得上述两个需求都能满足,一是具有通用性的业务风险综合评估体系,二是能够明显区分出风险用户和非风险用户,本专利技术主要有以下解决思路。针对问题一,解决思路是涵盖了主观赋权和客观赋权两种权重生成方法,作为体系的第一层权重。针对问题二,解决思路是基于逼近各指标理想点的目标构建目标函数,求解组合赋权的第二层权重。作为本专利技术实施例进一步的方案:步骤一中原始数据的来源为数据仓库抽取的多维度数据,包括业务数据、风控日志数据、SDK采集的设备数据、IP数据等。作为本专利技术实施例进一步的方案:步骤一的原始数据中的数值型数据要根据指标含义进行对应的标准化处理,标准化处理包括正向标准化、负向标准化和区间型标准化。作为本专利技术实施例进一步的方案:步骤二中采用多元统计分析中的Fisher判别方法和随机森林学习模型中的任意一种进行筛选,数据量不大的情况下,多元统计分析中的Fisher判别即可满足需求,数据量增大的情况下,随机森林学习模型的效率更高,计算指标之间的相关系数进行两者取其一的处理,两者间剔除相似度过高但影响度小的变量。作为本专利技术实施例进一步的方案:步骤三中主观赋权法包括层次分析法(AHP)、G1法和BWM法,客观赋权法包括熵权法、DEA模型和基尼系数赋权法。作为本专利技术实施例进一步的方案:步骤四中采用TOPSIS算法设计组合赋权权重的求解方案。作为本专利技术实施例进一步的方案:G1法的计算公式如下:rk是相邻指标之间重要程度之比,wk为第k个指标的权重,总体指标数量为m。与现有技术相比,本专利技术实施例的有益效果是:本专利技术提出了指标和模型相结合的权重生成方法,并使用实际数据验证了其有效性。本专利技术的用户总体风险评分方法具有风险识别能力,且评分能够将风险客户和非风险客户显著地区分开,安全风险等级评估体系更加直观;本专利技术的方法在不同行业的业务环境中具有一定的通用性,能够更好的区分优质用户和风险用户,使用前景广阔。附图说明图1为基于组合赋权的用户业务安全综合风险的评估方法的流程示意图。图2为基于组合赋权的用户业务安全综合风险的评估方法中TOPSIS算法的流程示意图。图3为基于组合赋权的用户业务安全综合风险的评估方法中风险指标筛选的流程示意图。图4为基于组合赋权的用户业务安全综合风险的评估方法的一种实际效果图。图5为基于组合赋权的用户业务安全综合风险的评估方法的另一种实际效果图。具体实施方式下面结合具体实施方式对本专利的技术方案作进一步详细地说明。实施例1一种基于组合赋权的用户业务安全综合风险的评估方法,具体步骤如下:步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化,形成初步的指标变量,原始数据的来源为数据仓库抽取的多维度数据,包括业务数据、风控日志数据、SDK采集的设备数据、IP数据等;步骤二,风险指标筛选:从区分度和相似度两个方面进行风险指标筛选;步骤三,计算单一方法赋权的权重系数:采用主观赋权法和客观赋权法分别生成权重系数;步骤四,求解多种赋权方法的组合赋权权重,计算出各用户的综合风险分值。实施例2一种基于组合赋权的用户业务安全综合风险的评估方法,具体步骤如下:步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化,形成初步的指标变量,原始数据中的数值型数据要根据指标含义进行对应的标准化处理,标准化处理包括正向标准化、负向标准化和区间型标准化;假设vij表示用户i的第j维变量的指标值,训练集样本量为n,标准化后的指标值为xij。和用户风险呈负相关的指标可选择正向标准化,计算方法如下:和用户风险呈正相关的指标可选择负向标准化,计算方法如下:当变量取值在合理范围[q1,q2]内时用户均不存在明显风险,则可选择如下所示的区间标准化:分类变量或定性指标可根据标签类型进行打分实现编码。例如,指纹js加密解密结果是否相符合。步骤二,风险指标筛选:本专利技术所提出的用户安全风险的综合评估是由多个定量或定性的评级指标构成的指标体系,从区分度和相似度两个方面进行风险指标筛选,以确保构建所用的指标能够反映风险状况、区分风险程度,进行风险指标筛选的方法和建模前变量选择的方法共通,数据量不大的情况下,多元统计分析中的Fisher判别方法即可满足需求;而数据量增大的情况下,随机森林学习模型的效率更高。为避免代入相似性过高的指标导致指标体系冗余,再基于相似度进行筛选。具体而言,计算指标之间的相关系数进行两者取其一的处理,两者间剔除相似度过高但影响度小的变量;Fisher判别方法是以风险状态为因变量、以评级指标为自变量建立Fisher判别函数。根据Fisher判别函数的高低,反映特定指标对违约状态的影响程度,剔除对风险状态的判别没有影响的指标。随机森林学习模型是根据训练所得本文档来自技高网
...

【技术保护点】
1.一种基于组合赋权的用户业务安全综合风险的评估方法,其特征在于,具体步骤如下:/n步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化,形成初步的指标变量;/n步骤二,风险指标筛选:从区分度和相似度两个方面进行风险指标筛选;/n步骤三,计算单一方法赋权的权重系数:采用主观赋权法和客观赋权法分别生成权重系数;/n步骤四,求解多种赋权方法的组合赋权权重,计算出各用户的综合风险分值。/n

【技术特征摘要】
1.一种基于组合赋权的用户业务安全综合风险的评估方法,其特征在于,具体步骤如下:
步骤一,数据处理:对原始数据进行频数统计、比例计算和标签化,形成初步的指标变量;
步骤二,风险指标筛选:从区分度和相似度两个方面进行风险指标筛选;
步骤三,计算单一方法赋权的权重系数:采用主观赋权法和客观赋权法分别生成权重系数;
步骤四,求解多种赋权方法的组合赋权权重,计算出各用户的综合风险分值。


2.根据权利要求1所述的基于组合赋权的用户业务安全综合风险的评估方法,其特征在于,所述步骤一中原始数据的来源为数据仓库抽取的多维度数据,包括业务数据、风控日志数据、SDK采集的设备数据和IP数据。


3.根据权利要求2所述的基于组合赋权的用户业务安全综合风险的评估方法,其特征在于,所述步骤一的原始数据中的数值型数据要根据...

【专利技术属性】
技术研发人员:钱沁莹魏国富葛胜利汲丽钟丹阳
申请(专利权)人:上海观安信息技术股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1