标签化信息生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37489946 阅读:24 留言:0更新日期:2023-05-07 09:29
本申请涉及一种标签化信息生成方法、装置、计算机设备和存储介质。所述方法包括:当目标对象在当前视频平台的观看记录未达到预设条件时,获取目标对象在其它视频平台的历史观看记录,历史观看记录包括观看过的各视频的视频信息以及对应的观看行为信息;从各视频的视频信息中提取各视频的视频标签;根据各视频标签下的各视频的视频信息和对应的观看行为信息,确定各视频标签的权重;根据各视频标签及其权重,生成目标对象的标签化信息,由当前视频平台基于标签化信息为目标对象推荐视频。采用本方法能够更为准确地预测目标对象的兴趣倾向。倾向。倾向。

【技术实现步骤摘要】
标签化信息生成方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种标签化信息生成方法、装置、计算机设备和存储介质。

技术介绍

[0002]用户画像即用户信息标签化,企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据,抽象出一个用户的商业全貌是企业应用大数据技术的基本方式。在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,即生成用户画像,从而为用户提供有针对性的服务。标签通常是高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京。
[0003]短视频平台通常基于用户画像为用户推荐视频,用户画像作为推荐系统的主要输入,对推荐效果至关重要。为建立个性化功能,推荐系统会给用户大规模打上几万甚至几千万的标签,包括偏好、偏好程度值,例如,某个用户画像如图1所示,其中概率用于表征可信度,概率越大可以理解为可信度越高,偏好值用于表征喜欢程度,偏好值越大可以理解为越喜欢。
[0004]传统技术中,短视频平台生成用户画像的数据来源于端本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签化信息生成方法,其特征在于,所述方法包括:当目标对象在当前视频平台的观看记录未达到预设条件时,获取所述目标对象在其它视频平台的历史观看记录,所述历史观看记录包括观看过的各视频的视频信息以及对应的观看行为信息;从各所述视频的视频信息中提取各所述视频的视频标签;根据各所述视频标签下的各视频的视频信息和对应的观看行为信息,确定各所述视频标签的权重;根据各所述视频标签及其权重,生成所述目标对象的标签化信息,由所述当前视频平台基于所述标签化信息为所述目标对象推荐视频。2.根据权利要求1所述的方法,其特征在于,所述获取所述目标对象在其它视频平台的历史观看记录,包括:确定所述目标对象在其它视频平台关联的账号,获取所述账号在所述其它视频平台的历史观看记录;当根据所述账号在所述其它视频平台的登录设备情况确定所述账号对应一个使用者时,将所述账号在所述其它视频平台的历史观看记录,作为所述目标对象在所述其它视频平台的历史观看记录;当根据所述账号在所述其它视频平台的登录设备情况确定所述账号对应多个使用者时,获取所述目标对象登录所述当前视频平台的设备标识,从所述账号在所述其它视频平台的历史观看记录中,筛选出与所述设备标识关联的历史观看记录,作为所述目标对象在所述其它视频平台的历史观看记录。3.根据权利要求2所述的方法,其特征在于,还包括下述各项中的至少一项:当所述账号在最近预设时长内登录所述其它视频平台的移动设备数量超过第一阈值时,确定所述账号对应多个使用者;当所述账号在最近预设时长内登录所述其它视频平台的同一类型移动设备数量超过第二阈值时,确定所述账号对应多个使用者。4.根据权利要求1所述的方法,其特征在于,所述视频信息包括视频类别和视频标题;所述从各所述视频的视频信息中提取各所述视频的视频标签,包括:当各所述视频的视频类别为电视剧、电影、综艺或动漫时,将各所述视频的视频标题作为各所述视频的视频标签。5.根据权利要求1所述的方法,其特征在于,所述视频信息包括视频时长,所述观看行为信息包括观看次数以及各次观看的观看时长和观看时间;所述根据各所述视频标签下的各视频的视频信息和对应的观看行为信息,确定各所述视频标签的权重,包括:对于每一视频标签下的每一视频的每次观看,根据所述视频在本次观看下的观看时长和观看时间,...

【专利技术属性】
技术研发人员:王士超刘刚刚李奘
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1