【技术实现步骤摘要】
用户数据的处理方法和装置
本专利技术涉及计算机应用
,尤其涉及一种用户数据的处理方法、以及一种实现该方法的装置。
技术介绍
目前,获取用户的兴趣数据的第一种方法为:基于用户主动输入的信息获取用户的兴趣数据,比如,根据用户在新浪微博或百度知道中主动输入的信息挖掘出用户的兴趣数据。上述现有技术中的获取用户的兴趣数据的方法的缺点为:依赖于用户的主动输入信息的行为,在用户不主动输入信息时,该方法无法获取用户的兴趣数据。获取用户的兴趣数据的第二种方法为:基于用户在单一产品中的行为数据获取用户的兴趣数据。例如Google搜索引擎中,通过记录分析特定用户在本应用中使用行为,例如检索的搜索词、点击的查询结果来挖掘用户的兴趣数据;在百度知道中通过分析用户提出、回答问题的类别来挖掘用户的兴趣数据。上述现有技术中的获取用户的兴趣数据的方法的缺点为:该方法只是分析用户在单一产品中的行为数据,会造成获取的用户兴趣数据有产品偏向性。
技术实现思路
本专利技术的实施例提供了一种用户数据的处理方法和装置,以实现有效地获取用户的综合的无偏向的兴趣数据。一种用户数据的处理方法,包括:根据用户在某种产品中的行为数据,计算出所述用户在所述产品上的有偏向的兴趣类别分布信息;计算出所述有偏向的兴趣类别分布信息与所述产品的用户兴趣背景分布信息之间的差异值,根据所述差异值得到所述用户在所述产品上的无偏向的兴趣类别分布信息;将所述用户在多种产品上的无偏向的兴趣类别分布信息进行综合,获取所述用户的综合的兴趣类别分布信息。一种用户数据的处理装置,包括:有偏向兴趣类别分布信息获取模块,用于根据用户在某种产品中 ...
【技术保护点】
一种用户数据的处理方法,其特征在于,包括:根据用户在某种产品中的行为数据,计算出所述用户在所述产品上的有偏向的兴趣类别分布信息;计算出所述有偏向的兴趣类别分布信息与所述产品的用户兴趣背景分布信息之间的差异值,根据所述差异值得到所述用户在所述产品上的无偏向的兴趣类别分布信息;将所述用户在多种产品上的无偏向的兴趣类别分布信息进行综合,获取所述用户的综合的兴趣类别分布信息。
【技术特征摘要】
1.一种用户数据的处理方法,其特征在于,包括:根据用户在某种产品中的行为数据,计算出所述用户在所述产品上的有偏向的兴趣类别分布信息;计算出所述有偏向的兴趣类别分布信息与所述产品的用户兴趣背景分布信息之间的差异值,根据所述差异值得到所述用户在所述产品上的无偏向的兴趣类别分布信息;其中,所述用户兴趣背景分布信息是指设定数量的用户在所述产品中的行为数据,所述产品的用户兴趣背景分布信息是通过计算设定数量用户在该产品上的兴趣类别分布信息的平均值而得到的;将所述用户在多种产品上的无偏向的兴趣类别分布信息进行综合,获取所述用户的综合的兴趣类别分布信息。2.根据权利要求1所述的用户数据的处理方法,其特征在于,所述的根据用户在某种产品中的行为数据,计算出所述用户在所述产品上的有偏向的兴趣类别分布信息,包括:预先设定包括多种兴趣类别的兴趣类别体系;获取用户在某种产品中的行为数据,通过设定的映射方法得到所述行为数据所对应的所述兴趣类别体系中的多种兴趣类别和每种兴趣类别的权重值;根据所述多种兴趣类别和每种兴趣类别的权重值,构造出所述用户在所述产品中的有偏向的兴趣类别分布信息。3.根据权利要求1所述的用户数据的处理方法,其特征在于,所述的方法还包括:根据某种产品上设定数量的用户的行为数据对应的有偏向的兴趣类别分布信息,确定该产品的用户兴趣背景分布信息,再根据该产品中包含的用户兴趣影响特性,对该产品的用户兴趣背景分布信息中相应兴趣类别的权重值进行调整,而得到最终的该产品的用户兴趣背景分布信息。4.根据权利要求2所述的用户数据的处理方法,其特征在于,所述的计算出所述有偏向的兴趣类别分布信息与所述产品的用户兴趣背景分布信息之间的差异值,根据所述差异值得到所述用户在所述产品上的无偏向的兴趣类别分布信息,包括:通过相对熵散度衡量方法计算出用户在某种产品上的行为数据所对应的有偏向的兴趣类别分布信息与上述某种产品的用户兴趣背景分布信息之间的差异值,将所述差异值作为所述用户在所述产品上的无偏向的兴趣类别分布信息;分别计算出用户在多种产品上的无偏向的兴趣类别分布信息。5.根据权利要求1或2或3或4所述的用户数据的处理方法,其特征在于,所述的将所述用户在多种产品上的无偏向的兴趣类别分布信息进行综合,获取所述用户的综合的兴趣类别分布信息,包括:根据经验值设定用户在每种产品上的无偏向的兴趣类别分布信息对应的线性组合参数;或者,基于支持向量机方法学习得到用户在每种产品上的无偏向的兴趣类别分布信息对应的线性组合参数;根据每种兴趣类别分布信息对应的线性组合参数,使用线性组合方式将用户在每种产品上的兴趣类别分布信息叠加在一起,得到所述用户的综合的兴趣类别分布信息。6.一种用户数据的处理装置,其特征在于,...
【专利技术属性】
技术研发人员:邸楠,刘玉璇,肖慧,贾自艳,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。