基于用户画像构建的风险控制系统及方法技术方案

技术编号:27142995 阅读:26 留言:0更新日期:2021-01-27 21:29
本发明专利技术涉及风险控制技术领域,具体涉及基于用户画像构建的风险控制系统及方法。所述系统包括:数据处理模块、用户画像构建模块和风险控制模块;所述数据处理模块,配置用于获取用户数据,对获取的用户数据进行数据预处理,对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述用户数据至少包括:用户信息和用户历史行为,所述用户历史行为唯一隶属于一个用户信息。其利用用户的历史行为数据构建用户画像,实现了风险控制的精确化和科学化;同时在进行用户画像构建过程中,采用创新的数据分类算法,提升了用户画像构建的准确性和效率。画像构建的准确性和效率。画像构建的准确性和效率。

【技术实现步骤摘要】
基于用户画像构建的风险控制系统及方法


[0001]本专利技术属于风险控制
,具体涉及基于用户画像构建的风险控制系统及方法。

技术介绍

[0002]目前我国银行和金融机构基本把金融前期的调查和审核工作作为风险控制的重心,却忽略了由于金融前期信息审核不到位或者欺诈信息金融后,导致的金融后期风险。我国银行和金融机构对于贷后管理工作目前还借助于人工发现风险,比如实地调查、电话核实等手段,而人工风险存在的弊端主要包括以下方面:
[0003]人员成本高:不管是实地调查还是电话核实,都需要大量的成本。
[0004]贷后风险意识缺乏:由于国内大环境下的影响,对于贷后风险管理的认知不足,注重贷前及贷中,贷后管理成了摆设。
[0005]人员能力:贷后管理人员发现及处置风险的能力参差不齐,导致风险的发现和规避不及时。
[0006]风险延迟:由于人工调查、电话核实等不确定因素多,如客户联系困难等造成的风险延迟规避困难。
[0007]预警数据缺乏:贷后管理数据来源主要依赖于贷前审查的数据作为依据,而借款用户数据不会一成不变,如果仅仅参考用户金融申请的数据,已经不足以发现贷后风险。
[0008]由于以上原因,导致我国银行和金融机构对于贷后风险管理的工作困难重重,贷后欺诈、金融逾期、恶意拖欠等扰乱金融市场秩序的行为依旧频繁发生。

技术实现思路

[0009]有鉴于此,本专利技术的主要目的在于提供基于用户画像构建的风险控制系统及方法,其利用用户的历史行为数据构建用户画像,实现了风险控制的精确化和科学化;同时在进行用户画像构建过程中,采用创新的数据分类算法,提升了用户画像构建的准确性和效率。
[0010]为达到上述目的,本专利技术的技术方案是这样实现的:
[0011]基于用户画像构建的风险控制系统,所述系统包括:
[0012]数据处理模块,配置用于获取用户数据,对获取的用户数据进行数据预处理,对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述用户数据至少包括:用户信息和用户历史行为,所述用户历史行为唯一隶属于一个用户信息;在进行所述数据分类时,基于预设的分类模型,将用户信息对应的多个用户历史行为进行分类,对每个分类后的用户历史行为添加数据类别标签;所述数据类别标签至少包括:低风险、中风险和高风险三个类别;
[0013]用户画像构建模块,配置用于基于每个用户信息对应的多个添加数据类别标签后的用户历史行为,使用预设的模型,构建该用户对应的用户画像;
[0014]风险控制模块,配置用于将构建的用户画像与预设的不同金融风险等级的种子用户进行关联,得到不同金融风险等级的用户画像数据;再根据不同金融风险等级的用户画像数据进行用户分级。
[0015]进一步的,所述数据处理模块包括:数据采集单元,配置用于获取用户数据;数据预处理单元,配置用于对获取的用户数据进行数据预处理;所述数据预处理过程具体包括:去除唯一属性、处理缺失值、异常值检测及处理、数据规约处理和数据标准化处理;数据分类单元,配置用于对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述数据分类过程具体包括:将用户数据预处理的结果随机划分为两个集合T1和T2;根据所述的两个集合T1和T2,使用如下公式构建的分类模型,对用户数据预处理的结果据进行分类:结果据进行分类:结果据进行分类:其中,λ
m
为集合分类项的权值,取值范围为:1~5;g为分类数,取值为3或6;v位修正项的权值,取值范围为0.1~0.4;为梯度算子,H(T)为修正函数,设定为线性函数,线性函数的参数能够进行设置;为集合T1和T2的估计概率密度函数,p
m
为集合T1和T2的概率密度函数;δ为强度均值调整参数,取值范围为:3~5;I为强度均值函数。
[0016]进一步的,所述数据预处理单元,对获取的用户数据进行数据预处理的方法包括:去除唯一属性、处理缺失值和异常值检测及处理;进行数据规约处理,包括:去平均值、计算协方差矩阵、计算协方差矩阵的特征值与特征向量、对特征值从大到小排序、保留最大的k特征向量、将数据转换到特征向量构建的新空间中;最后得处理后的新的数据,这些数据之间两两不相干,但保持原有的信息。进行数据标准化处理,将数据按比例缩放,使之落入一个设定的区间。
[0017]进一步的,所述风险控制模块包括:风险关联单元,配置用于将构建的用户画像与预设的不同金融风险等级的种子用户进行关联,得到不同金融风险等级的用户画像数据;风险等级建立单元,配置用于基于不同金融风险等级的用户画像数据训练得到金融风险等级的分级模型,并利用所述分级模型对预设应用程序上的用户进行分级,分为不同金融风险等级。
[0018]进一步的,所述用户画像构建模块,基于每个用户信息对应的多个添加数据类别标签后的用户历史行为,使用预设的模型,构建该用户对应的用户画像的方法包括:根据所述用户历史行为及所述用户历史行为的类别,构建中间画像;根据所述中间画像构建所述用户画像;所述根据所述中间画像及所述中间画像的类型,构建中间画像具体包括:计算所述中间画像的向量的平均值,通过所述向量的平均值表达所述中间画像的语义;根据所述中间画像的向量的平均值,计算同一类型的所述中间画像的向量平均值,将所述向量平均值作为所述中间画像;当所述中间画像包括一个或多个所述类型时,构建一个或多个所述中间画像。
[0019]基于用户画像构建的风险控制方法,所述方法执行以下步骤:
[0020]步骤1:获取用户数据,对获取的用户数据进行数据预处理,对用户数据预处理的
结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述用户数据至少包括:用户信息和用户历史行为,所述用户历史行为唯一隶属于一个用户信息;在进行所述数据分类时,基于预设的分类模型,将用户信息对应的多个用户历史行为进行分类,对每个分类后的用户历史行为添加数据类别标签;所述数据类别标签至少包括:低风险、中风险和高风险三个类别;
[0021]步骤2:基于每个用户信息对应的多个添加数据类别标签后的用户历史行为,使用预设的模型,构建该用户对应的用户画像;
[0022]步骤3:将构建的用户画像与预设的不同金融风险等级的种子用户进行关联,得到不同金融风险等级的用户画像数据;再根据不同金融风险等级的用户画像数据进行用户分级。
[0023]进一步的,所述步骤1中:对获取的用户数据进行数据预处理的方法包括:去除唯一属性、处理缺失值和异常值检测及处理;进行数据规约处理,包括:去平均值、计算协方差矩阵、计算协方差矩阵的特征值与特征向量、对特征值从大到小排序、保留最大的特征向量、将数据转换到特征向量构建的新空间中;最后得处理后的新的数据,这些数据之间两两不相干,但保持原有的信息。进行数据标准化处理,将数据按比例缩放,使之落入一个设定的区间。
[0024]进一步的,所述步骤1中:对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于用户画像构建的风险控制系统,其特征在于,所述系统包括:数据处理模块,配置用于获取用户数据,对获取的用户数据进行数据预处理,对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述用户数据至少包括:用户信息和用户历史行为,所述用户历史行为唯一隶属于一个用户信息;在进行所述数据分类时,基于预设的分类模型,将用户信息对应的多个用户历史行为进行分类,对每个分类后的用户历史行为添加数据类别标签;所述数据类别标签至少包括:低风险、中风险和高风险三个类别;用户画像构建模块,配置用于基于每个用户信息对应的多个添加数据类别标签后的用户历史行为,使用预设的模型,构建该用户对应的用户画像;风险控制模块,配置用于将构建的用户画像与预设的不同金融风险等级的种子用户进行关联,得到不同金融风险等级的用户画像数据;再根据不同金融风险等级的用户画像数据进行用户分级。2.如权利要求1所述的系统,其特征在于,所述数据处理模块包括:数据采集单元,配置用于获取用户数据;数据预处理单元,配置用于对获取的用户数据进行数据预处理;所述数据预处理过程具体包括:去除唯一属性、处理缺失值、异常值检测及处理、数据规约处理和数据标准化处理;数据分类单元,配置用于对用户数据预处理的结果进行数据分类,对每个类别的用户数据添加数据类别标签;所述数据分类过程具体包括:将用户数据预处理的结果随机划分为两个集合T1和T2;根据所述的两个集合T1和T2,使用如下公式构建的分类模型,对用户数据预处理的结果据进行分类:型,对用户数据预处理的结果据进行分类:型,对用户数据预处理的结果据进行分类:其中,λ
m
为集合分类项的权值,取值范围为:1~5;g为分类数,取值为3或6;v位修正项的权值,取值范围为0.1~0.4;为梯度算子,H(T)为修正函数,设定为线性函数,线性函数的参数能够进行设置;为集合T1和T2的估计概率密度函数,p
m
为集合T1和T2的概率密度函数;δ为强度均值调整参数,取值范围为:3~5;I为强度均值函数。3.如权利要求2所述的系统,其特征在于,所述数据预处理单元,对获取的用户数据进行数据预处理的方法包括:去除唯一属性、处理缺失值和异常值检测及处理;进行数据规约处理,包括:去平均值、计算协方差矩阵、计算协方差矩阵的特征值与特征向量、对特征值从大到小排序、保留最大的k特征向量、将数据转换到特征向量构建的新空间中;最后得处理后的新的数据,这些数据之间两两不相干,但保持原有的信息。进行数据标准化处理,将数据按比例缩放,使之落入一个设定的区间。4.如权利要求3所述的系统,其特征在于,所述风险控制模块包括:风险关联单元,配置用于将构建的用户画像与预设的不同金融风险等级的种子用户进行关联,得到不同金融风险等级的用户画像数据;风险等级建立单元,配置用于基于不同金融风险等级的用户画像数据训练得到金融风险等级的分级模型,并利用所述分级模型对预设应用程序上的用户进行分级,分为不同金融风险等级。
5.如权利要求4所述的系统,其特征在于,所述用户画像构建模块,基于每个用户信息对应的多个添加数据类别标签后的用户历史行为,使用预设的模型,构建该用户对应的用户画像的方法包括:根据所述用户历史行为及所述用户历史行为的类别,构建中间画像;根据所述中间画像构建所述用户画像;所述根据所述中间画像及所述中间画像的类型,构建中间画像具体包括:计算所述中间画像的向量的平均值,通过所述向量的平均值表达所述中间画像的语义;根据所述中间画像的向量的平均值,计算同一类型的所述中间画像的向量平均值,将所述向量平均值作为所述中间...

【专利技术属性】
技术研发人员:柴秀富
申请(专利权)人:杭州伍暨通信设备有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1