用户画像生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：31907287 阅读：44 留言：0更新日期：2022-01-15 12:46

本发明专利技术实施例提供一种用户画像生成方法、装置、电子设备及存储介质，方法包括：接收到使用目标应用时产生的当前实时行为数据时，根据第一时段内的实时行为数据的行为标签和当前实时行为数据，基于目标计算策略生成第一用户画像；在与上一次生成第二用户画像的时间间隔为预设时长的目标时刻，根据第二时段内的实时行为数据的行为标签和预设时段内的实时行为数据，基于目标计算策略生成第二用户画像，第二时段、预设时段相连续，预设时段对应预设时长；第二时段的时长大于预设时长、第一时段的时长，目标计算策略依据目标格式的实时行为数据生成用户画像。本发明专利技术满足了短期画像的实时性要求以及长期画像的全面性要求，保证了长短期画像的一致性。期画像的一致性。期画像的一致性。

全部详细技术资料下载

【技术实现步骤摘要】
用户画像生成方法、装置、电子设备及存储介质

[0001]本专利技术涉及数据处理
，尤其涉及一种用户画像生成方法、装置、电子设备及存储介质。

技术介绍

[0002]现有技术中，需要结合用户行为生成用户画像，所生成的用户画像可应用于个性化推荐和搜索等场景。其中，用户画像既需要反映用户的实时兴趣，要求更新延时尽可能小；又需要反映用户的中长期兴趣，要求数据尽可能全面。
[0003]目前，短期画像由流任务处理，长期画像由批任务处理。专利技术人发现，现有技术中在生成用户画像时，存在如下问题：
[0004]1、长期画像和短期画像的任务完全独立，计算解析的逻辑独立，需单独维护；2、由于数据源和计算代码不同，会出现长期画像和短期画像不一致的问题。

技术实现思路

[0005]本专利技术实施例提供一种用户画像生成方法、装置、电子设备及存储介质，以解决现有技术中在生成用户画像时存在的长短期画像相互独立，需单独维护以及易出现长短期画像不一致的问题。
[0006]在本专利技术实施例的第一方面，提供了一种用户...

【技术保护点】

【技术特征摘要】
1.一种用户画像生成方法，其特征在于，包括：在目标用户使用目标应用时，接收到产生的当前实时行为数据的情况下，根据第一时段内的实时行为数据对应的行为标签以及当前实时行为数据，基于目标计算策略生成用于指示所述目标用户的短期行为偏好的第一用户画像，所述第一时段的终止时刻为获取当前实时行为数据的第一时刻；在目标时刻，根据第二时段内的实时行为数据对应的行为标签以及预设时段内的实时行为数据，基于所述目标计算策略生成用于指示所述目标用户的长期行为偏好的第二用户画像，所述目标时刻为与上一次生成所述第二用户画像的时间间隔为预设时长的时刻，所述第二时段的终止时刻为所述预设时段的初始时刻，所述预设时段的终止时刻为所述目标时刻，且所述预设时段的时长为所述预设时长；其中，所述第二时段的时长大于所述预设时长、所述第二时段的时长大于所述第一时段的时长，用于生成所述第一用户画像和所述第二用户画像的实时行为数据对应于相同的目标格式，所述目标计算策略用于依据所述目标格式的实时行为数据进行用户画像的生成。2.根据权利要求1所述的用户画像生成方法，其特征在于，所述根据第一时段内的实时行为数据对应的行为标签以及当前实时行为数据，基于目标计算策略生成用于指示所述目标用户的短期行为偏好的第一用户画像，包括：根据当前实时行为数据，确定对应的行为标签，并基于所述目标计算策略获取所确定的所述行为标签的标签分值；针对所述第一时段内的实时行为数据对应的行为标签，根据所述目标计算策略进行标签分值更新；根据所确定的所述行为标签的标签分值以及更新后的标签分值，生成目标用户画像，所述目标用户画像为所述第一用户画像；其中，每条实时行为数据对应于至少一个所述行为标签，且不同的所述行为标签对应的标签内容相区别。3.根据权利要求1所述的用户画像生成方法，其特征在于，所述根据第二时段内的实时行为数据对应的行为标签以及预设时段内的实时行为数据，基于目标计算策略生成用于指示所述目标用户的长期行为偏好的所述第二用户画像，包括：根据所述预设时段内的实时行为数据，确定对应的行为标签，并基于所述目标计算策略获取所确定的所述行为标签的标签分值；针对所述第二时段内的实时行为数据对应的行为标签，根据所述目标计算策略进行标签分值更新；根据所确定的所述行为标签的标签分值以及更新后的标签分值，生成目标用户画像，所述目标用户画像为所述第二用户画像；其中，每条实时行为数据对应于至少一个所述行为标签，且不同的所述行为标签对应的标签内容相区别。4.根据权利要求2或3所述的用户画像生成方法，其特征在于，所述目标计算策略为与行为权重和时间权重关联的策略，所述行为权重用于表征实时行为数据所对应行为的重要程度，所述目标计算策略包括第一计算策略和第二计算策略；
所述基于所述目标计算策略获取所确定的所述行为标签的标签分值，包括：当获取当前实时行为数据对应的行为标签的标签分值时，基于所述第一计算策略，确定当前实时行为数据对应的行为标签的行为权重和时间权重，并根据所述行为标签的行为权重和时间权重确定当前实时行为数据对应的行为标签的标签分值；当获取所述预设时段内的实时行为数据对应的行为标签的标签分值时，基于所述第二计算策略，确定所述预设时段内的实时行为数据对应的行为标签的行为权重和时间权重，并根据所述行为标签的行为权重和时间权重确定所述预设时段内的实时行为数据对应的行为标签的标签分值；其中，所述第一计算策略和所述第二计算策略的计算标签分值的计算规则相同，所述第一计算策略包括确定所述行为权重的第一规则和确定所述时间权重的第二规则，所述第二计算策略包括确定所述行为权重的第三规则和确定所述时间权重的第四规则，实时行为数据的采集时刻与所述第一时刻间隔时长、实时行为数据的采集时刻与所述目标时刻的间隔时长，均与所述时间权重负相关，所述行为权重和所述时间权重均与所述标签分值正相关。5.根据权利要求4所述的用户画像生成方法，其特征在于，所述根据所述目标计算...

【专利技术属性】
技术研发人员：燕宁，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人