基于机器学习的用户风险分类方法、装置、介质及设备制造方法及图纸

技术编号:20364451 阅读:11 留言:0更新日期:2019-02-16 17:14
本公开是关于一种基于机器学习的用户风险分类方法、装置及设备,属于人工智能技术领域,该方法包括:首先获取用户未结合网络行为的静态特征数据和结合网络行为的动态特征数据;然后,将上述两种特征数据剔除目标剔除特征数据后输入预先训练的随机森林模型后输出用户风险等级;其次,将上述两种特征的数据中剔除目标剔除特征数据后的特征数据、以及随机森林模型输出的用户风险等级输入预先训练的逻辑回归模型后输出用户风险评分;最后,根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类。本公开通过机器学习模型利用用户静态特征和动态特征数据对用户风险进行分类,有效提高了风险分类的准确性。

【技术实现步骤摘要】
基于机器学习的用户风险分类方法、装置、介质及设备
本公开涉及人工智能领域,具体而言,涉及一种基于机器学习的用户风险分类方法、装置、介质及设备。
技术介绍
用户风险是指用户在某些环境下,某些时间内,由于外界因素或者用户本身行为造成的内部因素带来的可能会致使用户产生损失的可能性;用户风险的分类就是根据用户的操作环境下的外界因素和内部因素对用户风险按照产生风险的可能性进行评估。现有的用户评分体系基本上为基于用户属性的评分卡模型或者基于黑白名单分级,这样基于未结合用户网络行为的静态属性信息的评估方式不利于评价拥有大体量用户的平台中用户的风险,会造成评估的片面性和不准确性,因此需要基于用户的行为数据加以补充,根据未结合用户网络行为的静态特征数据与结合用户网络行为的动态特征数据来评价用户的风险等级。更重要的是,现有方法中对用户风险采用机器学习模型进行用户风险分类时一般采用单一的机器学习模型,评估结果具有局限性,分类结果不够准确,因此需要考虑多个机器学习模型的结合评估方式,结合多个机器学习模型的优点互相补充,从而得到更加准确地分析结果,不会造成用户风险评估时的误伤问题,采用随机森林模型结合逻辑回归模型对用户进行风险评估既可以保证高的运算效率,高的模型结果精度,以及低的输入数据加工成本,又可以低成本的高效率的将用户风险特征加工成风险分数,综合随机森林模型和逻辑回归模型的结果可以更加准确的进行用户风险分类。所以,通过随机森林模型结合逻辑回归模型根据用户静态特征数据和动态特征数据对用户风险进行分类的体系具有极高的意义。因此,需要提供一种新的基于机器学习的用户风险分类方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种基于机器学习的用户风险分类方法、装置、介质及设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的由于用户特征数据不够全面,分类模型单一造成的分类结果不准确的问题。根据本公开的一个方面,提供一种用户风险分类方法,包括:获取用户静态特征数据,所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征;获取用户动态特征数据,所述用户动态特征数据表示用户的网络行为表现出来的特征;剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型,所述随机森林模型输出用户风险等级;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级,输入预先训练的逻辑回归模型,由逻辑回归模型输出用户风险评分;根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类。在本公开的一种示例性实施例中,根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类,具体包括:如果所述随机森林模型输出的用户风险等级满足第一预定用户风险等级条件,且所述逻辑回归模型输出的用户风险评分大于第一预定用户风险评分阈值,则将用户分类为异常网络行为用户;如果所述随机森林模型输出的用户风险等级满足第二预定用户风险等级条件,且所述逻辑回归模型输出的用户风险评分小于第二预定用户风险评分阈值,则将用户分类为正常网络行为用户;否则,将用户分类为待定网络行为用户。在本公开的一种示例性实施例中,根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类,具体包括:将所述随机森林模型输出的用户风险等级换算成等级分数;确定所述等级分数与所述用户风险评分的加权和,作为风险总分数;基于所述风险总分数,对用户进行风险上的分类。在本公开的一种示例性实施例中,所述用户静态特征数据包括以下中的至少一个:所述用户是否属于黑名单中的用户;所述用户的注册信息特征;所述用户的网络消费特征。在本公开的一种示例性实施例中,所述用户动态特征数据包括以下中的至少一个:所述用户单位时间更换网络地址的次数;所述用户单位时间更换上网设备的次数;所述用户单位时间产生同一操作路径的次数。在本公开的一种示例性实施例中,所述用户单位时间更换网络地址的次数通过如下方式确定:基于所述用户注册时的手机号或身份证号,确定所述用户注册时的手机号或身份证号对应的用户的单位时间上网次数,其中,从用户登录到互联网到退出互联网,称为一次上网;确定所述用户单位时间内每次上网用的网络地址;基于所述用户单位时间内相邻两次上网所用的网络地址的一致性,确定所述用户单位时间内更换网络地址的次数,其中,如果所述用户一次上网用的网络地址与前一次不一致,则更换了一次网络地址。在本公开的一种示例性实施例中,所述用户单位时间更换上网设备的次数通过如下方式确定:基于所述用户注册时的手机号或身份证号,确定所述用户注册时的手机号或身份证号对应的用户的单位时间上网次数,其中,从用户登录到互联网到退出互联网,称为一次上网;确定所述用户单位时间内每次上网用的上网设备;基于所述用户单位时间内相邻两次上网所用的上网设备的一致性,确定所述用户单位时间内更换上网设备的次数,其中,如果所述用户一次上网用的上网设备与前一次不一致,则更换了一次上网设备。根据本公开的一个方面,提供一种用户风险分类装置,包括:第一获取模块,用于获取用户静态特征数据,所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征;第二获取模块,用于获取用户动态特征数据,所述用户动态特征数据表示用户的网络行为表现出来的特征;剔除模块,用于剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据;第一评估模块,用于将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型,所述随机森林模型输出用户风险等级;第二评估模块,用于将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级,输入预先训练的逻辑回归模型,由逻辑回归模型输出用户风险评分;综合评估模块,用于根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。本公开一种用户风险分类方法、装置、计算机可读存储介质以及电子设备。首先,获取用户静态特征数据和用户动态特征数据,所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征,所述用户动态特征数据表示用户的网络行为表现出来的特征;这样可以获取所有可能造成用户风险可能性的用户特征数据,从而可以进行全面的评估,使得风险评估更加准确、可靠。然后,将用户静态特征数据和用户动态特征数据中的除目标剔除特征数据之外的特征数据输入预先训练的随机森林模型,所述随机森林模型输出用户风险等级;这本文档来自技高网
...

【技术保护点】
1.一种用户风险分类方法,其特征在于,包括:获取用户静态特征数据,所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征;获取用户动态特征数据,所述用户动态特征数据表示用户的网络行为表现出来的特征;剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型,所述随机森林模型输出用户风险等级;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级,输入预先训练的逻辑回归模型,由逻辑回归模型输出用户风险评分;根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类。

【技术特征摘要】
1.一种用户风险分类方法,其特征在于,包括:获取用户静态特征数据,所述用户静态特征数据表示在未结合用户网络行为的情况下表现出来的特征;获取用户动态特征数据,所述用户动态特征数据表示用户的网络行为表现出来的特征;剔除用户静态特征数据和用户动态特征数据中的目标剔除特征数据;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据输入预先训练的随机森林模型,所述随机森林模型输出用户风险等级;将剔除了目标剔除特征数据后的用户静态特征数据和用户动态特征数据的特征数据、以及随机森林模型输出的用户风险等级,输入预先训练的逻辑回归模型,由逻辑回归模型输出用户风险评分;根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类。2.根据权利要求1所述的方法,其特征在于,所述根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类,具体包括:如果所述随机森林模型输出的用户风险等级满足第一预定用户风险等级条件,且所述逻辑回归模型输出的用户风险评分大于第一预定用户风险评分阈值,则将用户分类为异常网络行为用户;如果所述随机森林模型输出的用户风险等级满足第二预定用户风险等级条件,且所述逻辑回归模型输出的用户风险评分小于第二预定用户风险评分阈值,则将用户分类为正常网络行为用户;否则,将用户分类为待定网络行为用户。3.根据权利要求1所述的方法,其特征在于,所述根据随机森林模型输出的用户风险等级和逻辑回归模型输出的用户风险评分,对用户进行风险上的分类,具体包括:将所述随机森林模型输出的用户风险等级换算成等级分数;确定所述等级分数与所述用户风险评分的加权和,作为风险总分数;基于所述风险总分数,对用户进行风险上的分类。4.根据权利要求1所述的方法,其特征在于,所述用户静态特征数据包括以下中的至少一个:所述用户是否属于黑名单中的用户;所述用户的注册信息特征;所述用户的网络消费特征。5.根据权利要求1所述的方法,其特征在于,所述用户动态特征数据包括以下中的至少一个:所述用户单位时间更换网络地址的次数;所述用户单位时间更换上网设备的次数;所述用户单位时间产生同一操作路径的次数。6.根据权利要求5所述的方法,其特征在于,所述用户单位时间更换网络地址的次数通过如下方式确定...

【专利技术属性】
技术研发人员:于洋马宁
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1