确定潜在黑用户特征的方法、装置、设备和存储介质制造方法及图纸

技术编号:21184610 阅读:27 留言:0更新日期:2019-05-22 15:13
本公开涉及大数据技术领域,揭示了一种确定潜在黑用户特征的方法、装置、设备和存储介质。所述方法包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。通过本公开的各实施例,可以实现对潜在黑用户特征的挖掘,并形成风险用户画像。

Methods, devices, devices and storage media for identifying the characteristics of potential black users

The present disclosure covers the field of large data technology and discloses a method, device, device and storage medium for determining the characteristics of potential black users. The method includes: determining the association among the multiple user features contained in the multiple historical access records according to the multiple historical access records; marking the user features in the black user feature list of the multiple user features as black user features according to the existing black user feature list, and associating the multiple user features with the black user features. User features are marked as grey user features; the correlation strength between each grey user feature and the black user feature in the grey user feature is calculated based on the correlation among the determined multiple user features; and the grey user feature whose correlation strength exceeds the first predetermined threshold is determined as a potential black user feature. Through various embodiments of the present disclosure, it is possible to mine the characteristics of potential black users and form a portrait of a risky user.

【技术实现步骤摘要】
确定潜在黑用户特征的方法、装置、设备和存储介质
本专利技术涉及大数据
,特别是涉及一种用于确定潜在黑用户特征的方法、装置、计算设备和计算机可读存储介质。
技术介绍
在互联网应用领域,为了降低风险和减小损失,通常需要建立黑用户名单,以屏蔽黑用户的不良行为。现有的风险规避方式一般是将用户的特征与黑用户名单中的特征进行比对,并根据比对结果通过和拒绝用户的请求。通过这种方式可以识别出具有已知黑用户特征的用户。但是,黑用户特征名单具有一定的局限性,其仅包括已被确认了的黑用户特征,过滤范围较小,无法满足需要。
技术实现思路
为解决以上问题中的一个或多个,本专利技术实施例提供了一种用于确定潜在黑用户特征的方法、装置、计算设备和计算机可读存储介质。根据本申请的第一方面,提供一种用于确定潜在黑用户特征的方法,其包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。根据一示例性实施例,所述计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度包括如下中的一个或多个:对于每个灰用户特征,统计该灰用户特征与每个所述黑用户特征之间具有的关联条数,并将统计出的所述关联条数中最大的关联条数作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与其他用户特征之间具有的关联总条数以及该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,将所述关联条数之和与所述关联总条数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的用户特征中为所述黑用户特征的个数,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的所有用户特征的总个数以及所述所有用户特征中为所述黑用户特征的个数,将所述个数与所述总个数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,将所述关联条数之和与所述关联总条数的比值以及所述个数与所述总个数的比值的加权和作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,根据TF-IDF算法,计算该灰用户特征关于与其有关联的每个黑用户特征的TF*IDF值,并将所计算出的TF*IDF值中最大的TF*IDF值作为所述关联强度,其中TF为该灰用户特征关于该黑用户特征的关联频次,IDF为所述多条历史访问记录的条数与所述多个用户特征中属于第一用户特征类别的用户特征的个数的比值的对数,其中第一用户特征类别为该黑用户特征所属于的用户特征类别。根据一示例性实施例,所述计算该灰用户特征和与其有关联的每个黑用户特征之间的TF*IDF值作为所述关联强度包括:通过计算该灰用户特征与该黑用户特征之间具有的关联条数与所述多条历史访问记录中包含该黑用户特征的历史访问记录的条数的比值,作为所述频次。根据一示例性实施例,在所述根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度之前,还包括:根据TF-IDF算法,计算所述多个用户特征中每个用户特征关于与其有关联的每个其他用户特征的TF*IDF值,其中TF为该用户特征关于该其他用户特征的关联频次,IDF为所述多条历史访问记录的条数与所述多个用户特征中属于第一用户特征类别的用户特征的个数的比值的对数,其中第一用户特征类别为该其他用户特征所属于的用户特征类别;将TF*IDF值小于第二预定阈值的关联从所确定的所述多个用户特征之间的关联中去除。根据一示例性实施例,所述方法还包括:根据已有的白用户特征列表,将所述潜在黑用户特征中在所述白用户特征列表中的用户特征确定为不是潜在黑用户特征。根据一示例性实施例,所述方法还包括:从所确定的所述多个用户特征之间的关联中筛选出所述黑用户特征与所述潜在黑用户特征之间的关联;根据所筛选出来的关联和所述已有的黑用户特征列表中的所有黑用户特征之间的关联,形成关联图谱,其中,在所述关联图谱中,将所述黑用户特征和所述潜在黑用户特征中的每个用户特征表示为一个节点,将两个用户特征之间的一条关联表示为代表所述两个用户特征的两个节点之间的一条连线。根据一示例性实施例,所述用户特征包括手机号、IP地址、MAC地址、设备ID、访问时间中的一个或多个。根据本申请的第二方面,提供一种确定潜在黑用户特征的装置,其包括:关联确定模块,其被配置为:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;特征标记模块,其被配置为:根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;关联强度计算模块,其被配置为:根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;潜在黑特征确定模块,其被配置为:将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。根据一示例性实施例,所述关联强度计算模块包括如下中的一个或多个:第一计算单元,其被配置为:对于每个灰用户特征,统计该灰用户特征与每个所述黑用户特征之间具有的关联条数,并将统计出的所述关联条数中最大的关联条数作为该灰用户特征与所述黑用户特征之间的关联强度;第二计算单元,其被配置为:对于每个灰用户特征,统计该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,作为该灰用户特征与所述黑用户特征之间的关联强度;第三计算单元,其被配置为:对于每个灰用户特征,统计该灰用户特征与其他用户特征之间具有的关联总条数以及该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,将所述关联条数之和与所述关联总条数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;第四计算单元,其被配置为:对于每个灰用户特征,统计与该灰用户特征具有关联的用户特征中为所述黑用户特征的个数,作为该灰用户特征与所述黑用户特征之间的关联强度;第五计算单元,其被配置为:对于每个灰用户特征,统计与该灰用户特征具有关联的所有用户特征的总个数以及所述所有用户特征中为所述黑用户特征的个数,将所述个数与所述总个数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;第六计算单元,其被配置为:对于每个灰用户特征,将所述关联条数之和与所述关联总条数的比值以及所述个数与所述总个数的比值的加权和作为该灰用户特征与所述黑用户特征之间的关联强度;TF-IDF计算单元,其被配置为:对于每个灰用户特征,根据本文档来自技高网...

【技术保护点】
1.一种用于确定潜在黑用户特征的方法,其特征在于,包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。

【技术特征摘要】
1.一种用于确定潜在黑用户特征的方法,其特征在于,包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。2.如权利要求1所述的方法,其特征在于,所述计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度包括如下中的一个或多个:对于每个灰用户特征,统计该灰用户特征与每个所述黑用户特征之间具有的关联条数,并将统计出的所述关联条数中最大的关联条数作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与其他用户特征之间具有的关联总条数以及该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,将所述关联条数之和与所述关联总条数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的用户特征中为所述黑用户特征的个数,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的所有用户特征的总个数以及所述所有用户特征中为所述黑用户特征的个数,将所述个数与所述总个数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,将所述关联条数之和与所述关联总条数的比值以及所述个数与所述总个数的比值的加权和作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,根据TF-IDF算法,计算该灰用户特征关于与其有关联的每个黑用户特征的TF*IDF值,并将所计算出的TF*IDF值中最大的TF*IDF值作为所述关联强度,其中TF为该灰用户特征关于该黑用户特征的关联频次,IDF为所述多条历史访问记录的条数与所述多个用户特征中属于第一用户特征类别的用户特征的个数的比值的对数,其中第一用户特征类别为该黑用户特征所属于的用户特征类别。3.如权利要求2所述的方法,其特征在于,所述计算该灰用户特征和与其有关联的每个黑用户特征之间的TF*IDF值作为所述关联强度包括:通过计算该灰用户特征与该黑用户特征之间具有的关联条数与所述多条历史访问记录中包含该黑用户特征的历史访...

【专利技术属性】
技术研发人员:于洋马宁孙家棣
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1