互联网消费贷反欺诈风险识别方法及系统技术方案

技术编号:37989920 阅读:14 留言:0更新日期:2023-06-30 10:04
本发明专利技术公开了一种互联网消费贷反欺诈风险识别方法及系统,该方法包括:采集大量用户与消费贷业务相关的运营商特有数据及金融数据;通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本;利用所述建模样本建立风险预测模型;获取待识别用户的借贷相关信息;将所述借贷相关信息输入所述风险预测模型,计算所述待识别用户的评分;根据所述评分确定所述待识别用户是否存在骗取消费贷欺诈行为。利用本发明专利技术方案,可以更准确地评估互联网消费贷反欺诈风险。网消费贷反欺诈风险。网消费贷反欺诈风险。

【技术实现步骤摘要】
互联网消费贷反欺诈风险识别方法及系统


[0001]本专利技术涉及风险管理
,具体涉及一种互联网消费贷反欺诈风险识别方法及系统。

技术介绍

[0002]随着普惠金融的发展,金融机构与互联网平台合作强度不断加深,通过互联网平台面向客户提供消费贷款产品应运而生。在健全多层次金融市场的同时,也使得金融欺诈产业呈现指数级增加。对此,传统监管手段已不足以应对日趋复杂的金融风险。欺诈风险管理已被银行、金融机构和网络电商平台等经济主体视为最重要的任务之一。风险管理过程的欺诈风险识别是经济主体贷款批准决策的关键部分,如何防范和识别欺诈行为成为当前面临的一个具有挑战性的问题。
[0003]传统的风险评估方法主要是利用多维度数据通过相关数据进行定性分析。然而,随着金融服务的增长,这种模型已经难以反映风险变量之间的非线关系。虽然基于现代金融理论和新工具的现代方法,如欺诈检测模型、欺诈度量模型等,这些模型通常基于外生参数来确定欺诈风险概率,取得了较大的成就,但由于大多数模型对其正态分布的假设很难真实反应风险的实际分布,一但发生欺诈行为将会对企业造成重大损失,影响风险评估的准确性。因此,随着信息技术的发展,人工智能技术被引入到反欺诈风险评估中,如决策树、XGBoost(eXtreme Gradient Boosting,极度梯度提升树)、随机森林和LightGBM(Light Gradient Boosting Machine,轻量级的梯度提升算法)等。并且由于其大规模并行、分步式存储和处理、自组织和自学习能力,以及在处理非线性信息方面的优势,已经成为反欺诈风险管理中有效的估计方法,其中LightGBM具有更快的训练速度、更低的内存消耗、更好的准确率等优势应用十分广泛。
[0004]但现有技术难以适配复杂金融场景,特别是针对新兴的互联网消费贷业务适配度不高,泛化能力不强。同时,数据资源不充分,难以观察用户行为,使得风险策略评估效果较差。且就常见XGBoost算法应用而言,其存在预排序过程的空间复杂度高,以及难以应对大数据,导致内存消耗高等缺点。

技术实现思路

[0005]本专利技术提供一种互联网消费贷风险反欺诈风险识别方法及系统,可以更准确地评估互联网消费贷反欺诈风险。
[0006]为此,本专利技术提供如下技术方案:
[0007]一种互联网消费贷反欺诈风险识别方法,所述方法包括:
[0008]采集大量用户与消费贷业务相关的运营商特有数据及金融数据;
[0009]通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本;
[0010]利用所述建模样本建立风险预测模型;
[0011]获取待识别用户的借贷相关信息;
[0012]将所述借贷相关信息输入所述风险预测模型,计算所述待识别用户的评分;
[0013]根据所述评分确定所述待识别用户是否存在骗取消费贷欺诈行为。
[0014]可选地,所述金融数据包括以下任意一项或多项:总资产级别、近12个月理财产品购买次数,个贷授信总额度、信用卡持卡最高等级、历史贷款最长逾期天数、还款记录;所述运营商特有数据包括以下任意一项或多项:用户APP使用信息、位置信息、用户网页访问信息、用户关键词搜索信息。
[0015]可选地,所述通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本包括:
[0016]对所述运营商特有数据及所述金融数据进行探索性分析处理,得到处理后的数据;
[0017]对所述处理后的数据进行特征衍生,得到数据特征及衍生特征;
[0018]对所述数据特征及衍生特征进行编码,得到编码特征;
[0019]从所述数据特征、衍生特征和编码特征中进行特征选择,将选择的特征作为入模变量,生成建模样本。
[0020]可选地,对所述运营商特有数据及所述金融数据进行探索性分析处理包括以下任意一种或多种处理:
[0021]数据预处理;
[0022]对变量的分布进行可视化处理;
[0023]数值型特征数据转换处理;
[0024]类别特征分析。
[0025]可选地,所述对所述处理后的数据进行特征衍生,得到数据特征及衍生特征包括以下任意一项或多项:
[0026]按月统计近半年用户登陆借贷APP频率变异系数;
[0027]汇总用户近一、三、六个月登录借贷APP的次数;
[0028]观察近半年借贷APP使用个数增量;
[0029]计算各时段下用户通话频次;
[0030]确定用户通话活跃时间分布情况;
[0031]确定用户的网络浏览情况、以及所述网络的类型、浏览频次和流量情况。
[0032]可选地,所述从所述衍生特征和编码特征中进行特征选择包括:采用以下任意一种方法从所述衍生特征和编码特征中进行特征选择:方差选择法、相关系数法、卡方检验法、递归特征消除法、基于树模型的特征选择方法。
[0033]可选地,所述利用所述建模样本建立风险预测模型包括:
[0034]利用所述建模样本拟合LightGBM模型,并利用GridSearvhCV网格交叉验证调参方法对所述LightGBM模型进行参数调整,得到最优模型参数;
[0035]将最优模型参数的LightGBM模型作为风险预测模型。
[0036]可选地,所述待识别用户的借贷相关信息包括:所述待识别用户登录借贷APP的次数、时段、位置信息、网页访问信息、用户关键词搜索信息。
[0037]可选地,所述将所述借贷相关信息输入所述风险预测模型,计算所述待识别用户的评分包括:
[0038]计算所述待识别用户的每个特征信息的得分;
[0039]将所有特征信息的得分相加,并加上基础分,得到所述待识别用户的评分。
[0040]一种互联网消费贷反欺诈风险识别系统,所述系统包括:模型构建模块、以及预测模块;
[0041]所述模型构建模块包括:
[0042]数据采集单元,用于采集大量用户与消费贷业务相关的运营商特有数据及金融数据;
[0043]样本生成单元,用于通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本;
[0044]模型训练单元,用于利用所述建模样本建立风险预测模型;
[0045]所述预测模块,用于获取待识别用户的借贷相关信息,将所述借贷相关信息输入所述风险预测模型,计算所述待识别用户的评分;根据所述评分确定所述待识别用户是否存在骗取消费贷欺诈行为。
[0046]本专利技术提供的互联网消费贷反欺诈风险识别方法及系统,借助于运营商特有的丰富“数据矿产”资源,数据中蕴藏着巨大的用户行为等信息,这些信息对于企业而言都是强有效的信息资源,使得用户画像精细度有所提升。利用这些数据及用户的金融数据,训练基于LightGBM算法的风险预测模型,符合运营商大规模数据的处理场景,相较于其他算法来说具有更强的鲁棒性,在新兴的互联网消费贷反欺诈方面的预测效果也更好。
附图说明
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种互联网消费贷反欺诈风险识别方法,其特征在于,所述方法包括:采集大量用户与消费贷业务相关的运营商特有数据及金融数据;通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本;利用所述建模样本建立风险预测模型;获取待识别用户的借贷相关信息;将所述借贷相关信息输入所述风险预测模型,计算所述待识别用户的评分;根据所述评分确定所述待识别用户是否存在骗取消费贷欺诈行为。2.根据权利要求1所述的方法,其特征在于:所述金融数据包括以下任意一项或多项:总资产级别、近12个月理财产品购买次数,个贷授信总额度、信用卡持卡最高等级、历史贷款最长逾期天数、还款记录;所述运营商特有数据包括以下任意一项或多项:用户APP使用信息、位置信息、用户网页访问信息、用户关键词搜索信息。3.根据权利要求2所述的方法,其特征在于,所述通过所述运营商特有数据及所述金融数据提取特征数据,生成建模样本包括:对所述运营商特有数据及所述金融数据进行探索性分析处理,得到处理后的数据;对所述处理后的数据进行特征衍生,得到数据特征及衍生特征;对所述数据特征及衍生特征进行编码,得到编码特征;从所述数据特征、衍生特征和编码特征中进行特征选择,将选择的特征作为入模变量,生成建模样本。4.根据权利要求3所述的方法,其特征在于,对所述运营商特有数据及所述金融数据进行探索性分析处理包括以下任意一种或多种处理:数据预处理;对变量的分布进行可视化处理;数值型特征数据转换处理;类别特征分析。5.根据权利要求3所述的方法,其特征在于,所述对所述处理后的数据进行特征衍生,得到数据特征及衍生特征包括以下任意一项或多项:按月统计近半年用户登陆借贷APP频率变异系数;汇总用户近一、三、六个月登录借贷APP的次数;观察近半年借贷APP使用个数增量;计算各时段下用户通话频次;确...

【专利技术属性】
技术研发人员:吕敏赵思雯李佳馨马放
申请(专利权)人:卓望信息技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1