基于机器学习的用户风险分类方法、装置、介质及设备制造方法及图纸

技术编号：20364451 阅读：11 留言：0更新日期：2019-02-16 17:14

本公开是关于一种基于机器学习的用户风险分类方法、装置及设备，属于人工智能技术领域，该方法包括：首先获取用户未结合网络行为的静态特征数据和结合网络行为的动态特征数据；然后，将上述两种特征数据剔除目标剔除特征数据后输入预先训练的随机森林模型后输出用户风险等级；其次，将上述两种特征的数据中剔除目标剔除特征数据后的特征数据、以及随机森林模型输出的用户风险等级输入预先训练的逻辑回归模型后输出用户风险评分；最后，根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分，对用户进行风险上的分类。本公开通过机器学习模型利用用户静态特征和动态特征数据对用户风险进行分类，有效提高了风险分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的用户风险分类方法、装置、介质及设备
本公开涉及人工智能领域，具体而言，涉及一种基于机器学习的用户风险分类方法、装置、介质及设备。
技术介绍
用户风险是指用户在某些环境下，某些时间内，由于外界因素或者用户本身行为造成的内部因素带来的可能会致使用户产生损失的可能性；用户风险的分类就是根据用户的操作环境下的外界因素和内部因素对用户风险按照产生风险的可能性进行评估。现有的用户评分体系基本上为基于用户属性的评分卡模型或者基于黑白名单分级，这样基于未结合用户网络行为的静态属性信息的评估方式不利于评价拥有大体量用户的平台中用户的风险，会造成评估的片面性和不准确性，因此需要基于用户的行为数据加以补充，根据未结合用户网络行为的静态特征数据与结合用户网络行为的动态特征数据来评价用户的风险等级。更重要的是，现有方法中对用户风险采用机器学习模型进行用户风险分类时一般采用单一的机器学习模型，评估结果具有局限性，分类结果不够准确，因此需要考虑多个机器学习模型的结合评估方式，结合多个机器学习模型的优点互相补充，从而得到更加准确地分析结果，不会造成用户风险评估时的误伤问题，采用随机森林模型结合逻辑回归模型对用户进行风险评估既可以保证高的运算效率，高的模型结果精度，以及低的输入数据加工成本，又可以低成本的高效率的将用户风险特征加工成风险分数，综合随机森林模型和逻辑回归模型的结果可以更加准确的进行用户风险分类。所以，通过随机森林模型结合逻辑回归模型根据用户静态特征数据和动态特征数据对用户风险进行分类的体系具有极高的意义。因此，需要提供一种新的基于机器学习的用户风险分类方法及装置...

【技术保护点】
1.一种用户风险分类方法，其特征在于，包括：获取用户静态特征数据，所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征；获取用户动态特征数据，所述用户动态特征数据表示用户的网络行为表现出来的特征；剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据；将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型，所述随机森林模型输出用户风险等级；将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级，输入预先训练的逻辑回归模型，由逻辑回归模型输出用户风险评分；根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分，对用户进行风险上的分类。

【技术特征摘要】
1.一种用户风险分类方法，其特征在于，包括：获取用户静态特征数据，所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征；获取用户动态特征数据，所述用户动态特征数据表示用户的网络行为表现出来的特征；剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据；将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型，所述随机森林模型输出用户风险等级；将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级，输入预先训练的逻辑回归模型，由逻辑回归模型输出用户风险评分；根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分，对用户进行风险上的分类。2.根据权利要求1所述的方法，其特征在于，所述根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分，对用户进行风险上的分类，具体包括：如果所述随机森林模型输出的用户风险等级满足第一预定用户风险等级条件，且所述逻辑回归模型输出的用户风险评分大于第一预定用户风险评分阈值，则将用户分类为异常网络行为用户；如果所述随机森林模型输出的用户风险等级满足第二预定用户风险等级条件，且所述逻辑回归模型输出的用户风险评分小于第二预定用户风险评分阈值，则将用户分类为正常网络行为用户；否则，将用户分类为待定网络行为用户。3.根据权利要求1所述的方法，其特征在于，所述根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分，对用户进行风险上的分类，具体包括：将所述随机森林模型输出的用户风险等级换算成等级分数；确定所述等级分数与所述用户风险评分的加权和，作为风险总分数；基于所述风险总分数，对用户进行风险上的分类。4.根据权利要求1所述的方法，其特征在于，所述用户静态特征数据包括以下中的至少一个：所述用户是否属于黑名单中的用户；所述用户的注册信息特征；所述用户的网络消费特征。5.根据权利要求1所述的方法，其特征在于，所述用户动态特征数据包括以下中的至少一个：所述用户单位时间更换网络地址的次数；所述用户单位时间更换上网设备的次数；所述用户单位时间产生同一操作路径的次数。6.根据权利要求5所述的方法，其特征在于，所述用户单位时间更换网络地址的次数通过如下方式确定...

【专利技术属性】
技术研发人员：于洋，马宁，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人