【技术实现步骤摘要】
一种相似用户识别方法、装置、相似用户识别设备和介质
本申请涉及计算机
,尤其涉及一种相似用户识别方法、装置、相似用户识别设备和介质。
技术介绍
在商户运营中,通常需要对特定目标用户进行识别分析,这类特定目标用户可以是具有某些共性消费特征的,也可以是一些不良的用户,根据识别结果,可以制定相应的运营管理策略。如,非法用户团伙通常为团伙行动,通过手机号以及邮箱等注册大量的虚假账号,并根据虚假账号进行不规范交易(如,洗钱),为净化运营环境,需要对非法用户团伙进行识别,进而对各非法用户进行屏蔽或惩治。因此,如何高效且有效的识别特定目标用户成为一种需求。
技术实现思路
本申请实施例提供一种相似用户识别方法、装置、相似用户识别设备和介质,用以在用户识别时,根据各用户在多个指定维度上的相关度,识别出相似类型的用户,提高用户识别的效率和精确度。一方面,提供一种相似用户识别方法,包括:针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待 ...
【技术保护点】
1.一种相似用户识别方法,其特征在于,包括:针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,所述分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;将对应的多维度综合相关度高于所述最优分隔阈值的各待识别用户,判定为相似用户。
【技术特征摘要】
1.一种相似用户识别方法,其特征在于,包括:针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,所述分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;将对应的多维度综合相关度高于所述最优分隔阈值的各待识别用户,判定为相似用户。2.如权利要求1所述的方法,其特征在于,针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,包括:针对任意两个待识别用户,确定任一属性对应的特征参数值的单属性相关度时,执行以下步骤:根据该任意两个待识别用户的该任一属性的特征参数值,确定该任意两个待识别用户之间针对该任一属性的维度距离,所述维度距离为两个用户在属性对应的维度上的差异性;根据该任一属性对应的维度距离,确定该任意两个待识别用户之间针对该任一属性的单属性相关度,所述单属性相关度与所述维度距离呈负相关。3.如权利要求1所述的方法,其特征在于,分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度,包括:分别将每两个待识别用户之间的各个单属性相关度归一化后的和,确定为该每两个待识别用户之间的多维度综合相关度;或者,分别将每两个待识别用户之间的各个单属性相关度归一化并进行加权后的和,确定为该每两个待识别用户之间的多维度综合相关度。4.如权利要求1-3任一项所述的方法,其特征在于,根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,包括:依次针对每一多维度综合相关度执行以下步骤:将该多维度综合相关度作为分隔阈值对各多维度综合相关度对应的待识别用户进行划分,获得指定类型集合和非指定类型集合;确定所述指定类型集合包含的待识别用户在所有待识别用户中的第一占比,以及所述指定类型集合的各待识别用户的多维度综合相关度的第一平均值,并确定所述非指定类型集合包含的待识别用户在所有待识别用户中的第二占比,以及所述非指定类型集合的各待识别用户的多维度综合相关度的第二平均值;根据所述第一平均值与所述第二平均值的差值的平方,所述第一...
【专利技术属性】
技术研发人员:杨洋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。