The present disclosure covers the field of large data technology and discloses a method, device, device and storage medium for determining the characteristics of potential black users. The method includes: determining the association among the multiple user features contained in the multiple historical access records according to the multiple historical access records; marking the user features in the black user feature list of the multiple user features as black user features according to the existing black user feature list, and associating the multiple user features with the black user features. User features are marked as grey user features; the correlation strength between each grey user feature and the black user feature in the grey user feature is calculated based on the correlation among the determined multiple user features; and the grey user feature whose correlation strength exceeds the first predetermined threshold is determined as a potential black user feature. Through various embodiments of the present disclosure, it is possible to mine the characteristics of potential black users and form a portrait of a risky user.
【技术实现步骤摘要】
确定潜在黑用户特征的方法、装置、设备和存储介质
本专利技术涉及大数据
,特别是涉及一种用于确定潜在黑用户特征的方法、装置、计算设备和计算机可读存储介质。
技术介绍
在互联网应用领域,为了降低风险和减小损失,通常需要建立黑用户名单,以屏蔽黑用户的不良行为。现有的风险规避方式一般是将用户的特征与黑用户名单中的特征进行比对,并根据比对结果通过和拒绝用户的请求。通过这种方式可以识别出具有已知黑用户特征的用户。但是,黑用户特征名单具有一定的局限性,其仅包括已被确认了的黑用户特征,过滤范围较小,无法满足需要。
技术实现思路
为解决以上问题中的一个或多个,本专利技术实施例提供了一种用于确定潜在黑用户特征的方法、装置、计算设备和计算机可读存储介质。根据本申请的第一方面,提供一种用于确定潜在黑用户特征的方法,其包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。根据一示例性实施例,所述计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度包括如下中的一个或多个:对于每个灰用户特征,统计该灰用户特征与每个所述黑用户特征之间具有的关 ...
【技术保护点】
1.一种用于确定潜在黑用户特征的方法,其特征在于,包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。
【技术特征摘要】
1.一种用于确定潜在黑用户特征的方法,其特征在于,包括:根据多条历史访问记录,确定所述多条历史访问记录中包含的多个用户特征之间的关联,其中将每条历史访问记录中所包含的一组用户特征视为两两之间均具有一条关联;根据已有的黑用户特征列表,将所述多个用户特征中在所述黑用户特征列表中的用户特征标记为黑用户特征,将所述多个用户特征中与所述黑用户特征具有关联的用户特征标记为灰用户特征;根据所确定的所述多个用户特征之间的关联,计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度;将所述关联强度超过第一预定阈值的灰用户特征确定为潜在黑用户特征。2.如权利要求1所述的方法,其特征在于,所述计算所述灰用户特征中每个灰用户特征与所述黑用户特征之间的关联强度包括如下中的一个或多个:对于每个灰用户特征,统计该灰用户特征与每个所述黑用户特征之间具有的关联条数,并将统计出的所述关联条数中最大的关联条数作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计该灰用户特征与其他用户特征之间具有的关联总条数以及该灰用户特征与所有所述黑用户特征之间具有的关联条数之和,将所述关联条数之和与所述关联总条数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的用户特征中为所述黑用户特征的个数,作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,统计与该灰用户特征具有关联的所有用户特征的总个数以及所述所有用户特征中为所述黑用户特征的个数,将所述个数与所述总个数的比值作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,将所述关联条数之和与所述关联总条数的比值以及所述个数与所述总个数的比值的加权和作为该灰用户特征与所述黑用户特征之间的关联强度;对于每个灰用户特征,根据TF-IDF算法,计算该灰用户特征关于与其有关联的每个黑用户特征的TF*IDF值,并将所计算出的TF*IDF值中最大的TF*IDF值作为所述关联强度,其中TF为该灰用户特征关于该黑用户特征的关联频次,IDF为所述多条历史访问记录的条数与所述多个用户特征中属于第一用户特征类别的用户特征的个数的比值的对数,其中第一用户特征类别为该黑用户特征所属于的用户特征类别。3.如权利要求2所述的方法,其特征在于,所述计算该灰用户特征和与其有关联的每个黑用户特征之间的TF*IDF值作为所述关联强度包括:通过计算该灰用户特征与该黑用户特征之间具有的关联条数与所述多条历史访问记录中包含该黑用户特征的历史访...
【专利技术属性】
技术研发人员:于洋,马宁,孙家棣,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。