用户画像生成方法、装置、电子设备及可读介质制造方法及图纸

技术编号:33285628 阅读:28 留言:0更新日期:2022-04-30 23:52
本发明专利技术实施例提供了一种用户画像生成方法,所述方法包括:获取用户使用应用程序时产生的实时用户行为信息;所述实时用户行为信息为指定窗口对应的用户行为信息,所述指定窗口用于表征指定数量或者指定时间时长;对所述实时用户行为信息进行分析得到标签信息;从预设的共现标签库中获取所述标签信息的扩展标签信息;将所述标签信息和所述扩展标签信息作为待确定标签信息;从所述待确定标签信息中确定作为所述用户的用户画像的标签信息,并根据确定的标签信息生成所述用户的用户画像。本发明专利技术实施例会基于共现标签库扩展标签信息后再生成用户画像,避免实时用户行为信息过少导致的用户画像不完备问题。用户画像不完备问题。用户画像不完备问题。

【技术实现步骤摘要】
用户画像生成方法、装置、电子设备及可读介质


[0001]本专利技术实施例涉及互联网
,特别是涉及一种用户画像生成方法、一种用户画像生成装置、一种电子设备以及一种计算机可读介质。

技术介绍

[0002]用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。其中,构建用户画像的核心工作即是给用户设置标签信息,而标签信息是通过对用户信息分析而来的高度精炼的特征标识。
[0003]在推荐场景中,为了给用户提供更精准的个性化推荐结果,需要使用到用户画像。例如,通过用户画像可以在海量候选商品中,筛选出用户最需要的商品,从而减少用户的无效浏览提升用户体验。
[0004]然而,现有用户画像的计算方案,往往需要使用较长时间内的历史用户信息,因此用户兴趣发生变化时,需要经过较长时间才能更新用户画像,导致基于用户画像不能快速获取用户的兴趣变化,也无法基于用户画像来为用户进行精确推荐。

技术实现思路

[0005]本专利技术实施例是提供一种用户画像生成方法、装置、电子设备以及计算机可读存储介质,以解决无本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用户画像生成方法,其特征在于,包括:获取用户使用应用程序时产生的实时用户行为信息;所述实时用户行为信息为指定窗口对应的用户行为信息,所述指定窗口用于表征指定数量或者指定时间时长;对所述实时用户行为信息进行分析得到标签信息;从预设的共现标签库中获取所述标签信息的扩展标签信息;将所述标签信息和所述扩展标签信息作为待确定标签信息;从所述待确定标签信息中确定作为所述用户的用户画像的标签信息,并根据确定的标签信息生成所述用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述指定窗口通过如下方式生成:统计所述用户每一次使用所述应用程序的交互行为次数;取所述交互行为次数的中位数作为指定窗口。3.根据权利要求1所述的方法,其特征在于,所述指定窗口通过如下方式生成:计算所述用户每一次使用所述应用程序的平均使用时长;将所述平均使用时长作为指定窗口。4.根据权利要求1所述的方法,其特征在于,所述共现标签库通过如下方式生成:获取所述用户历史使用应用程序时产生的历史用户行为信息;对所述历史用户行为信息进行分析得到历史标签信息;对于任一的所述历史标签信息,确定与所述历史标签信息在指定窗口内共现的每一其他历史标签信息的共现次数;确定所述历史标签信息与所有所述其他历史标签信息的总共现次数;将所述共现次数与所述总共现次数的比值,作为所述历史标签信息与对应的所述其他历史标签信息的共现度;将所述历史标签信息与对应的所述其他历史标签信息的所述共现度,保存到所述共现标签库中。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:计算所述待确定标签信息在所述实时用户行为信息中的词频;计算所述待确定标签信息的词频在历史行为数据中的逆文本词频;将所述词频和所述逆文本词频相乘,得到所述待确定标签信息的词频

逆文本频率指数;根据所述词频

逆文本频率指数调整所述待确定标签信息的权重值。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取各个所述待确定标签在所述用户行为信息中的出现次数;计算所有所述待确定标签在所述用户行为信息中的平均出现次数;当所述出现次数大于所述平均出现次...

【专利技术属性】
技术研发人员:朱雯茜
申请(专利权)人:北京五八信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1