用户特征提取方法及装置制造方法及图纸

技术编号:15329667 阅读:149 留言:0更新日期:2017-05-16 13:17
本发明专利技术实施例公开了一种用户特征提取方法及装置,所述方法包括:获取用户操作行为数据;解析所述操作行为数据,生成用户特征;根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗;其中,所述用户特征用于控制所述生效时间窗内的第一类信息的推荐概率。

Method and device for extracting user characteristic

The embodiment of the invention discloses a user feature extraction method and device, the method comprises: acquiring user behavior data; analysis of the operation data, generate user characteristics; according to the user operation time window behavior data where the effective time window is determined by the user characteristics; among them, the the user characteristics for the effective control recommended probability of the first type of information within the time window.

【技术实现步骤摘要】
用户特征提取方法及装置
本专利技术涉及信息
,尤其涉及一种用户特征提取方法及装置。
技术介绍
随着信息技术的发展,阅读应用服务的智能化越来越高。例如,可以通过用户特征的提取,仅向用户推荐其感兴趣的信息和/或避免向用户推荐其不感兴趣的信息,从而满足用户的个性需求,避免用户在海量的信息中查找自己感兴趣的信息,更好的利用了电子设备的软硬件资源,优化了用户阅读。要实现用户的个性推荐,则用户特征提取的精确性就非常重要了。现有技术中提供了很多种提取用户特征的方法,但是使用这些方式提取的用户特征进行信息推荐时,发现还不能满足预期的精确度。故如何提升用户特征提取的精确度是现有技术中进一步亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术实施例期望提供的一种用户特征提取方法及装置,至少部分用于解决用户特征提取不够精确的问题。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术实施例第一方面提供一种用户特征提取方法,包括:获取用户操作行为数据;解析所述操作行为数据,生成用户特征;根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗;其中,所述用户特征用于控制所述生效时间窗内的第一类信息的推荐概率。基于上述方案,所述解析所述操作行为数据,生成用户特征,包括:基于所述第一操作时间窗内的所述操作行为数据生成短期用户特征,并基于第二操作时间窗内的所述操作行为数据,生成长期用户特征;其中,第二操作时间窗的时长大于所述第一操作时间窗的时长;所述根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗,包括:根据所述操作时间窗的时长,生成所述短期用户特征的第一生效时间窗和所述长期用户特征的第二生效时间窗;其中,所述第二生效时间窗的时长大于所述第一生效时间窗的时长。基于上述方案,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,包括:解析所述操作行为数据,获取潜在长期特征集合中潜在长期特征的出现频次;确定潜在长期特征集合中包括的第一潜在长期特征对应的反向特征,是否是正式用户特征集合中的正式用户特征;若所述第一潜在长期特征不是所述正式用户特征,则确定所述第一潜在特征为所述长期用户特征。基于上述方案,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:若所述第一潜在长期特征为所述正式用户特征集合中的第一类正式用户特征,则将所述第一潜在长期特征从所述潜在长期特征集合中删除;所述第一类正式用户特征为评分值的排序在预定范围内的正式用户特征;其中,所述评分值所述评分值,用于控制与所述正式用户特征对应的信息的推荐概率。基于上述方案,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:若所述第一潜在长期特征为所述正式用户特征集合中的第二类正式用户特征,则调整所述第一潜在长期特征对应的正式用户特征的评分值;所述第二类正式用户特征为所述评分值在所述预定范围之外的特征。基于上述方案,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:统计所述短期用户特征在所述第二操作时间窗内的出现频次;当所述出现频次大于预定阈值时,将所述短期用户特征转化为所述长期用户特征。基于上述方案,所述基于所述第一操作时间窗内的所述操作行为数据生成短期用户特征,并基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:解析所述第一操作时间窗内的负向操作行为数据,生成短期负向特征;解析所述第二操作时间窗内的负向操作行为数据,生成长期负向特征;其中,所述负向操作行为数据表征的负向操作行为是减少信息显示的操作。基于上述方案,所述负向操作行为包括:删除操作和/或第一类关闭操作;所述第一类关闭操作包括信息链接的关闭操作,和/或,详细页面显示时间小于第一预定时长的关闭操作;所述信息链接是:进入所述信息链接对应的详细信息显示的详细页面的链接。本专利技术实施例第二方面提供一种用户特征提取装置,包括:获取单元,用于获取用户操作行为数据;解析单元,用于解析所述操作行为数据,生成用户特征;确定单元,用于根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗;其中,所述用户特征用于控制所述生效时间窗内的第一类信息的推荐概率。基于上述方案,所述解析单元,用于基于所述第一操作时间窗内的所述操作行为数据生成短期用户特征,并基于第二操作时间窗内的所述操作行为数据,生成长期用户特征;其中,第二操作时间窗的时长大于所述第一操作时间窗的时长;所述确定单元,具体用于根据所述操作时间窗的时长,生成所述短期用户特征的第一生效时间窗和所述长期用户特征的第二生效时间窗;其中,所述第二生效时间窗的时长大于所述第一生效时间窗的时长。基于上述方案,所述解析单元,具体用于解析所述操作行为数据,获取潜在长期特征集合中潜在长期特征的出现频次;确定潜在长期特征集合中包括的第一潜在长期特征对应的反向特征,是否是正式用户特征集合中的正式用户特征;若所述第一潜在长期特征的反向特征不是所述正式用户特征,则根据所述出现频次,确定所述第一潜在特征为所述长期用户特征。基于上述方案,所述解析单元,还具体用于若所述第一潜在长期特征的反向特征为所述正式用户特征集合中的第一类正式用户特征,则将所述第一潜在长期特征从所述潜在长期特征集合中删除;所述第一类正式用户特征为评分值的排序在预定范围内的正式用户特征;其中,所述评分值所述评分值,用于控制与所述正式用户特征对应的信息的推荐概率。基于上述方案,所述解析单元,还具体用于若所述第一潜在长期特征为所述正式用户特征集合中的第二类正式用户特征,则调整所述第一潜在长期特征的反向特征的评分值;所述第二类正式用户特征为所述评分值在所述预定范围之外的特征。基于上述方案,所述解析单元,具体用于统计所述短期用户特征在所述第二操作时间窗内的出现频次;当所述出现频次大于预定阈值时,将所述短期用户特征转化为所述长期用户特征。基于上述方案,所述解析单元,还用于解析所述第一操作时间窗内的负向操作行为数据,生成短期负向特征;解析所述第二操作时间窗内的负向操作行为数据,生成长期负向特征;其中,所述负向操作行为数据表征的负向操作行为是减少信息显示的操作。基于上述方案,所述负向操作行为包括:删除操作和/或第一类关闭操作;所述第一类关闭操作包括信息链接的关闭操作,和/或,详细页面显示时间小于第一预定时长的关闭操作;所述信息链接是:进入所述信息链接对应的详细信息显示的详细页面的链接。本专利技术实施例提供的一种用户特征提取方法及装置,会获取用户行为数据,并根据用户行为数据对应的操作时间窗,确定生效时间窗。显然,这样相对于现有技术,避免了一旦用户特征生成,就作为永久用户特征使用的现象。因为用户的喜好会发生变化,且在用户特征的提取过程中很难做到百分百准确。若一旦提取了一个特征就作为永久特征,随着时间的推移或若特征提取出现偏差的时候,会长期导致用户特征的不精确,若依据这种不精确的用户特征持续用户信息推送等处理,不仅可以实现用户个性化信息推送,反而招致用户反感且导致用户感兴趣的数据的无法有效传播。而本实施例中通过根据操作时间窗为用户特征设置生效时间窗,可以很好的解决上述问题,提升了用户特征的精确度。附图说明图1为本专利技术实施例提供的第一种用户特征本文档来自技高网...
用户特征提取方法及装置

【技术保护点】
一种用户特征提取方法,其特征在于,包括:获取用户操作行为数据;解析所述操作行为数据,生成用户特征;根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗;其中,所述用户特征用于控制所述生效时间窗内的第一类信息的推荐概率。

【技术特征摘要】
1.一种用户特征提取方法,其特征在于,包括:获取用户操作行为数据;解析所述操作行为数据,生成用户特征;根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗;其中,所述用户特征用于控制所述生效时间窗内的第一类信息的推荐概率。2.根据权利要求1所述的方法,其特征在于,所述解析所述操作行为数据,生成用户特征,包括:基于所述第一操作时间窗内的所述操作行为数据生成短期用户特征,并基于第二操作时间窗内的所述操作行为数据,生成长期用户特征;其中,第二操作时间窗的时长大于所述第一操作时间窗的时长;所述第一解析方式不同于所述第二解析方式。所述根据所述用户操作行为数据所在的操作时间窗,确定所述用户特征的生效时间窗,包括:根据所述操作时间窗的时长,生成所述短期用户特征的第一生效时间窗和所述长期用户特征的第二生效时间窗;其中,所述第二生效时间窗的时长大于所述第一生效时间窗的时长。3.根据权利要求2所述的方法,其特征在于,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,包括:解析所述操作行为数据,确定潜在长期特征集合中潜在长期特征对应的操作行为的出现频次;确定潜在长期特征集合中包括的第一潜在长期特征对应的反向特征,是否是正式用户特征集合中的正式用户特征;若所述第一潜在长期特征的反向特征不是所述正式用户特征,则根据所述出现频次,确定所述第一潜在特征为所述长期用户特征。4.根据权利要求3所述的方法,其特征在于,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:若所述第一潜在长期特征的反向特征为所述正式用户特征集合中的第一类正式用户特征,则将所述第一潜在长期特征从所述潜在长期特征集合中删除;所述第一类正式用户特征为评分值的排序在预定范围内的正式用户特征;其中,所述评分值所述评分值,用于控制与所述正式用户特征对应的信息的推荐概率。5.根据权利要求4所述的方法,其特征在于,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:若所述第一潜在长期特征为所述正式用户特征集合中的第二类正式用户特征,则调整所述第一潜在长期特征的反向特征的评分值;所述第二类正式用户特征为所述评分值在所述预定范围之外的特征。6.根据权利要求2所述的方法,其特征在于,所述基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,还包括:统计所述短期用户特征在所述第二操作时间窗内的出现频次;当所述出现频次大于预定阈值时,将所述短期用户特征转化为所述长期用户特征。7.根据权利要求6所述的方法,其特征在于,所述基于所述第一操作时间窗内的所述操作行为数据生成短期用户特征,并基于第二操作时间窗内的所述操作行为数据,生成长期用户特征,包括:解析所述第一操作时间窗内的负向操作行为数据,生成短期负向特征;解析所述第二操作时间窗内的负向操作行为数据,生成长期负向特征;其中,所述负向操作行为数据表征的负向操作行为是减少信息显示的操作。8.根据权利要求7所述的方法,其特征在于,所述负向操作包括:删除操作...

【专利技术属性】
技术研发人员:李会珠卫磊
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1