一种风控模型训练方法及装置制造方法及图纸

技术编号:15691778 阅读:270 留言:0更新日期:2017-06-24 05:15
本发明专利技术公开了一种风控模型训练方法,所述方法包括:获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。本发明专利技术还公开了一种风控模型训练装置。采用本发明专利技术提供的风控模型训练方法及装置,可以降低投诉率。

Method and device for training wind control model

The invention discloses a wind control model training method, the method comprises the following steps: the first group to obtain historical data of known results, the first group of historical data including abnormal user account information; according to the types of the account information from fitting the best data mining model for the basic model; using the basic model adjustment the first historical data in the account information dimension, generating second historical data; the first data using the second historical data in the group set the basic training model, second data using the second groups in the collection of historical data validate the basic model, according to the results of the validation selection model of risk control, the the risk control model for abnormal user identification in bill payment. The invention also discloses a wind control model training device. The air control model training method and device provided by the invention can reduce the complaint rate.

【技术实现步骤摘要】
一种风控模型训练方法及装置
本专利技术涉及数据处理技术,尤其涉及一种风控模型训练方法及装置。
技术介绍
在网络和电信的付费业务运行过程中,会出现支付异常的情况。例如,用户的账户被合作方采用代收、暗扣等违规方式进行扣费时,会导致用户出现财产损失,引起用户投诉;服务商使用某些非真实账户以自消费刷卡等方式进行消费,干扰付费业务正常运行;此外,某些对消费情况较为敏感的用户在付费业务扣费超过敏感值时,投诉可能性会大幅增长。只有准确地对网络和电信的付费业务运行过程中出现的异常用户进行识别,才能及时对异常用户采取相应的措施。
技术实现思路
为解决上述技术问题,本专利技术实施例提供一种风控模型训练方法及装置,以准确识别付费业务运行过程中出现的异常用户,降低投诉率。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种风控模型训练方法,包括:获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。上述方案中,所述账户信息包括多种类型;所述根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型,包括:根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,根据所述第一数据挖掘模型生成数据挖掘模型组;在所述数据挖掘模型组中针对所有所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型。上述方案中,所述账户信息的类型包括如下至少一种:消费敏感型、订购异常型、非真实型。上述方案中,所述根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,包括:使用所述第一历史数据组中的第三数据集合训练各种数据挖掘模型后,使用所述第一历史数据组中的第四数据集合验证所述数据挖掘模型;选取所述账户信息的类型对应的拟合度最高的数据挖掘模型为第一数据挖掘模型。上述方案中,所述数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶斯网络。本专利技术实施例提供一种风控模型训练装置,所述装置包括:获取单元,用于获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;第一选取单元,用于根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;生成单元,用于使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;第二选取单元,用于使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。上述方案中,所述账户信息包括多种类型;所述第一选取单元包括:生成子单元,用于根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,根据所述第一数据挖掘模型生成数据挖掘模型组;选取子单元,用于在所述数据挖掘模型组中针对所有所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型。上述方案中,所述账户信息的类型包括如下至少一种:消费敏感型、订购异常型、非真实型。上述方案中,所述生成子单元还用于:使用所述第一历史数据组中的第三数据集合训练各种数据挖掘模型后,使用所述第一历史数据组中的第四数据集合验证所述数据挖掘模型;选取所述账户信息的类型对应的拟合度最高的数据挖掘模型为第一数据挖掘模型。上述方案中,所述数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶斯网络。本专利技术实施例所提供的风控模型训练方法及装置,获取已知结果的历史数据组后,根据所述账户信息的类型选取拟合度最高的初阶模型;使用所述第二历史数据组中的数据训练并验证所述初阶模型后,根据验证结果选取风控模型,并使用所述风控模型识别异常用户。该技术方案可以准确识别付费业务运行过程中出现的异常用户,降低投诉率。附图说明图1为本专利技术实施例风控模型训练方法的实现流程图;图2为本专利技术实施例中异常订购型账户的决策树分析图;图3为本专利技术实施例中非真实型账户的决策树分析图;图4为本专利技术实施例风控模型训练装置的组成结构示意图。具体实施方式为了能够更加详尽地了解本专利技术的特点与
技术实现思路
,下面结合附图对本专利技术的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本专利技术。图1为本专利技术实施例风控模型训练方法的实现流程图,如图1所示,本专利技术实施例提供的风控模型训练方法,包括:步骤101,获取已知结果的第一历史数据组,第一历史数据组包括异常用户的账户信息。步骤102,根据账户信息的类型选取拟合度最高的初阶模型。步骤103,使用初阶模型调整第一历史数据中的账户信息的维度,生成第二历史数据组。步骤104,使用第二历史数据组中的第一数据集合训练初阶模型后,使用第二历史数据组中的第二数据集合验证初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。本专利技术实施例中,上述数据挖掘模型应用在数据挖掘软件中,其中,本专利技术实施例中的数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶斯网络,且并不局限于这八种类型。本专利技术实施例使用数据挖掘软件进行数据挖掘时,从多种类型的数据挖掘模型中选取拟合度最高的数据挖掘模型类型,并将该类型的数据挖掘模型进行训练、验证后,使用该训练、验证后的数据挖掘模型识别异常用户。相比较现有技术,使用该方案得到的训练验证后的最优数据挖掘模型识别异常用户时,可以得到更准确的识别结果。步骤101中的异常用户的账户信息与异常账户的类型相关。异常账户按照账户出现扣费异常的原因可以分为不同的种类。账户信息包括多种类型,在本专利技术实施例中,账户类型包括消费敏感型、订购异常型、非真实型三种,但在实际应用中并不局限于此。其中,消费敏感型账户对付费业务例如游戏类业务消费金额的敏感度较高,当消费金额超过敏感值时,用户的投诉的可能性将大幅增大。消费敏感型账户的账户信息包含以下数据信息的部分或全部:当月和上月的投诉结论、消费金额、消费次数、消费天数、小额道具付费次数、中额道具付费次数、高额道具付费次数、最高付费单价。订购异常型账户因为合作方的违规扣费等出现过财产损失。订购异常型账户的账户信息包含以下数据信息的部分或全部:国际移动设备身份码(IMEI)变动频繁、国际移动用户识别码(IMSI)变动频繁、业务消费类型与终端类型不一致、用户短时间消费多款业务/用户短时间内发起多款业务计费请求、启动游戏至第一次消费时间短、最后一次消费至退出游戏时间短、用户短时间多次消费一款业务/用户短时间内多次发起一款业务的计费请求、日消费金额、付费活跃度(最近60天付费次数)、使用活跃度(最近60天游戏使用次数)。非真实型账户是服务商自刷卡消费的卡号。非真实型账户的账户信息包括以下数据信息的部分或者全部:月累计消费金额、月累计消费次数、月累计消费业务数、月累计消费内本文档来自技高网
...
一种风控模型训练方法及装置

【技术保护点】
一种风控模型训练方法,其特征在于,所述方法包括:获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。

【技术特征摘要】
1.一种风控模型训练方法,其特征在于,所述方法包括:获取已知结果的第一历史数据组,所述第一历史数据组包括异常用户的账户信息;根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型;使用所述初阶模型调整所述第一历史数据中的账户信息的维度,生成第二历史数据组;使用所述第二历史数据组中的第一数据集合训练所述初阶模型后,使用所述第二历史数据组中的第二数据集合验证所述初阶模型,根据验证结果选取风控模型,所述风控模型用于识别话费支付中异常用户。2.根据权利要求1所述的方法,其特征在于,所述账户信息包括多种类型;所述根据所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型,包括:根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,根据所述第一数据挖掘模型生成数据挖掘模型组;在所述数据挖掘模型组中针对所有所述账户信息的类型选取拟合度最高的数据挖掘模型为初阶模型。3.根据权利要求2所述的方法,其特征在于,所述账户信息的类型包括如下至少一种:消费敏感型、订购异常型、非真实型。4.根据权利要求3所述的方法,其特征在于,所述根据所述账户信息的类型,为每种所述账户信息的类型选取对应的第一数据挖掘模型,包括:使用所述第一历史数据组中的第三数据集合训练各种数据挖掘模型后,使用所述第一历史数据组中的第四数据集合验证所述数据挖掘模型;选取所述账户信息的类型对应的拟合度最高的数据挖掘模型为第一数据挖掘模型。5.根据权利要求1至4任一项所述的方法,其特征在于,所述数据挖掘模型的类型包括如下至少一种:CRT、C5.0、CHAID、Logistic、SVM、自动分类器和贝叶...

【专利技术属性】
技术研发人员:王慧袁峰周振生
申请(专利权)人:咪咕互动娱乐有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1