【技术实现步骤摘要】
用户标签生成方法及装置
本专利技术涉及通信
,特别涉及一种用户标签生成方法及装置。
技术介绍
目前,服务器可以通过构建用户画像来确定产品的目标群体。用户画像用于刻画用户的特征,用户的特征包括用户的年龄、性别、兴趣、习惯、位置等特征。由于用户标签可以用来描述至少一种用户的特征,因此,服务器可以通过生成用户标签来得到用户画像。用户标签包括麦霸、文艺女青年、北京人、夜猫子等。其中,服务器生成用户标签,包括:采集至少一个用户设备中的用户数据;对该用户数据进行分析,得到使用该至少一个用户设备的用户的特征;根据该特征生成用户标签。其中,用户数据可以是用户的位置数据、年龄数据、行为习惯数据、兴趣爱好数据、健康状况数据等。由于服务器只能根据采集的用户数据生成用户标签,因此,在采集的用户数据较少时,生成的用户标签的数量较少。
技术实现思路
为了解决采集的用户数据较少时,生成的用户标签的数量较少的问题,本申请提供了一种用户标签生成方法及装置。第一方面,提供了一种用户标签生成方法,该方法包括:对于同种的用户设备中记录了用户数据的每个客户端,分别从该客户端所具有的特征属性中,获取与预设 ...
【技术保护点】
一种用户标签生成方法,其特征在于,所述方法包括:对于同种的用户设备中记录了用户数据的每个客户端,分别从所述客户端所具有的特征属性中,获取与预设的n种特征属性相同的至少一种特征属性,所述用户数据用于反映使用所述客户端的用户对所述客户端所执行的操作,所述特征属性用于反映所述客户端的目标用户群体共同具备的特征,所述n为正整数;根据每个客户端所具有的特征属性的数量,确定每个客户端所具有的至少一种特征属性中每种特征属性的权重信息,得到所述n种特征属性中每种特征属性的权重信息;利用预设的聚类指标k和每种特征属性的权重信息对所述同种的用户设备中记录了用户数据的所有客户端进行聚类,得到k个 ...
【技术特征摘要】
1.一种用户标签生成方法,其特征在于,所述方法包括:对于同种的用户设备中记录了用户数据的每个客户端,分别从所述客户端所具有的特征属性中,获取与预设的n种特征属性相同的至少一种特征属性,所述用户数据用于反映使用所述客户端的用户对所述客户端所执行的操作,所述特征属性用于反映所述客户端的目标用户群体共同具备的特征,所述n为正整数;根据每个客户端所具有的特征属性的数量,确定每个客户端所具有的至少一种特征属性中每种特征属性的权重信息,得到所述n种特征属性中每种特征属性的权重信息;利用预设的聚类指标k和每种特征属性的权重信息对所述同种的用户设备中记录了用户数据的所有客户端进行聚类,得到k个类别,每个类别包括至少一个客户端和每个客户端所属的用户设备,所述k为正整数;从所述k个类别中提取至少一个特征客户端,所述特征客户端用于反映所述用户设备的目标用户群体的共同兴趣;根据每个客户端记录的用户数据生成第一用户标签,并根据所述至少一个特征客户端生成第二用户标签。2.根据权利要求1所述的方法,其特征在于,每个客户端的用户数据包括所述客户端的运行频率,所述根据所述客户端所具有的特征属性的数量,确定所述客户端具有的至少一种特征属性中每种特征属性的权重信息,得到所述n种特征属性中每种特征属性的权重信息,包括:根据预设的权重总分和每个客户端所具有的特征属性的数量,设置每个客户端所具有的每种特征属性的权重,所述权重与所述客户端所具有的特征属性的数量呈负相关关系;根据每个客户端的运行频率和每个客户端所具有的每种特征属性的权重,确定每个客户端所具有的每种特征属性的权重信息;对于每个用户设备中记录了用户数据的所有客户端,将同种特征属性的权重信息相加,得到所述n种特征属性的权重信息。3.根据权利要求1所述的方法,其特征在于,每个客户端的用户数据包括所述客户端的运行频率和运行时间段,所述根据每个客户端所具有的特征属性的数量,确定每个客户端所具有的至少一种特征属性中每种特征属性的权重信息,得到所述n种特征属性中每种特征属性的权重信息,包括:根据预设的权重总分和每个客户端所具有的特征属性的数量,设置每个客户端所具有的每种特征属性的权重,所述权重与所述客户端所具有的特征属性的数量呈负相关关系;确定每个客户端的运行时间段所属的预设时间段,并确定每个客户端在对应的预设时间段内的运行频率,每个预设时间段对应所述n种特征属性;对于每个客户端,根据所述客户端在每个预设时间段内的运行频率和所述客户端所具有的每种特征属性的权重,确定所述客户端在每个预设时间段对应的每种特征属性的权重信息;对于每个用户设备中记录了用户数据的所有客户端,将同一预设时间段内的同种特征属性的权重信息相加,得到每个预设时间段对应的所述n种特征属性的权重信息。4.根据权利要求2或3所述的方法,其特征在于,所述利用预设的聚类指标k和每种特征属性的权重信息对所述同种的用户设备中记录了用户数据的所有客户端进行聚类,得到k个类别,包括:当所述同种的用户设备包括m个用户设备时,根据所述n种特征属性的权重信息生成m×p维的特征矩阵,当所述用户数据不包括每个客户端的运行时间段时,p=n;当所述用户数据包括每个客户端的运行时间段,且预设时间段的数量为q时,p=n×q;对所述特征矩阵进行归一化处理,得到m×p维的归一化矩阵;利用所述聚类指标k对所述归一化矩阵进行聚类,得到所述k个类别。5.根据所述权利要求4所述的方法,其特征在于,所述利用所述聚类指标k对所述归一化矩阵进行聚类,得到所述k个类别,包括:利用预设的降维算法和预设的降维指标l,对所述m×p维的归一化矩阵进行降维处理,得到m×l维的降维矩阵;利用所述聚类指标k对所述降维矩阵进行聚类,得到所述k个类别。6.根据权利要求4所述的方法,其特征在于,所述从所述k个类别中提取至少一个特征客户端,包括:确定所述k个类别中每个类别的中心客户端,所述中心客户端所属的用户设备的数量除以所述类别包括的用户设备的数量的值大于第一预设阈值;在存在中心客户端的j个类别中确定包括的用户设备的数量最大的类别,将确定的所述类别的至少一个中心客户端确定为所述至少一个特征客户端,0<j≤k。7.根据权利要求1至6任一所述的方法,其特征在于,所述对于同种的用户设备中记录了用户数据的每个客户端,分别从所述客户端所具有的特征属性中,获取与预设的n种特征属性相同的至少一种特征属性,包括:对于同种的用户设备中记录了用户数据的每个客户端,采集所述客户端记录的用户数据;按照预设规则对所述客户端记录的所有用户数据进行过滤,所述预设规则为记录所述用户数据的客户端的运行时长小于第二预设阈值,或者,在记录所述用户数据的客户端的运行时长大于第三预设阈值;当存在过滤后的用户数据时,从所述客户端具有的特征属性中,获取与预设的n种特征属性相同的至少一种特征属性。8.根据权利要求1至7任一所述的方法,其特征在于,所述从所述k个类别中提取至少一个特征客户端之后,还包括:当所述至少一个特征客户端的数量为r时,获取每个特征客户端的标识,将r个客户端中每个客户端的标识作为一种特征属性,得到n+r种特征属性,所述r为正整数;将n更新为n+r,触发执行所述根据每个客户端所具有的特征属性的数量,确定每个客户端所具有的至少一种特征属性中每种特征属性的权重信息,得到所述n种特征属性中每种特征属性的权重信息;利用预设的聚类指标k和每种特征属性的权重信息对所述同种的用户设备中记录了用户数据的所有客户端进行聚类,得到k个类别,从所述k个类别中提取至少一个特征客户端的步骤,直到提取所述特征客户端失败时停止。9.根据权利要求1所述的方法,其特征在于,在利用预设的聚类指标k和每种特征属性的权重信息对所述同种的用户设备中记录了用户数据的所有客户端进行聚类,得到k个类别之后,包括:对于所述k个类别中的每个类别,统计所述类别中每个...
【专利技术属性】
技术研发人员:熊安斌,张锋,张旭,
申请(专利权)人:华为软件技术有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。