一种视频点击行为的预测方法及装置制造方法及图纸

技术编号:38715093 阅读:9 留言:0更新日期:2023-09-08 14:57
本发明专利技术属于计算机技术领域,具体涉及一种视频点击行为的预测方法及装置,用以提高视频点击行为的预测准确率。该方法包括:获取目标用户的用户特征数据,确定与用户特征数据相对应的多维组合特征数据;将每个维度特征数据包含的数据项分别输入第一预测模型以及第二预测模型,获取输出的第一特征重要度以及第二特征重要度;通过第一特征重要度以及第二特征重要度生成数据项的融合特征重要度,并根据预设的特征重要度阈值从每个维度特征数据中筛选目标数据项;根据目标数据项预测目标用户的视频点击行为。该方式对数据进行多维化处理并通过多层次筛选剔除了无效数据,提升了预测模型泛化能力和预测准确性,使预测结果更有说服力。力。力。

【技术实现步骤摘要】
一种视频点击行为的预测方法及装置


[0001]本专利技术属于计算机
,具体涉及一种视频点击行为的预测方法及装置。

技术介绍

[0002]随着网络媒体平台的不断发展壮大,观看视频已经成为了一种时下主流的休闲娱乐方式。在现有技术中,视频平台通常会使用视频点击模型对用户的历史视频观看记录和浏览记录进行分析,以向对应的用户推送令其感兴趣的视频,提高用户的视频点击率。
[0003]但是,上述方式至少存在以下缺陷:一方面,由于现有的视频点击模型只针对用户的历史观看记录、历史浏览记录以及视频搜索记录等简单数据特征进行分析,使得视频点击模型的泛化能力差、预测的准确性较低。另一方面,现有的视频点击模型只会针对用户数据进行单层次、单一化筛选,导致用户数据的关联性较弱且存在较多无效数据,影响用户视频点击行为的预测结果。
[0004]由此可见,如何对用户数据特征进行筛选以剔除无效数据,以及如何提升模型的泛化能力和预测准确性,成为目前亟待解决的技术难题。

技术实现思路

[0005]本专利技术提出了一种视频点击行为的预测方法及装置,用以解决现阶段在预测用户视频点击行为时只针对简单数据特征进行分析导致模型泛化能力差且预测准确度较低、以及针对用户数据进行单层次单一化筛选导致用户数据关联性较弱,从而影响视频点击行为预测结果的问题。
[0006]第一方面,本公开提供了一种视频点击行为的预测方法,包括:
[0007]获取目标用户的用户特征数据,确定与所述用户特征数据相对应的多维组合特征数据;其中,所述多维组合特征数据包括多个维度特征数据,且每个维度特征数据中包含多个数据项;
[0008]将每个维度特征数据中包含的多个数据项分别输入第一预测模型以及第二预测模型,获取所述第一预测模型输出的与每个维度特征数据中包含的每个数据项的第一特征重要度,以及获取所述第二预测模型输出的与每个维度特征数据中包含的每个数据项的第二特征重要度;
[0009]根据所述第一特征重要度以及所述第二特征重要度,获取每个维度特征数据中包含的每个数据项的融合特征重要度;
[0010]根据所述每个维度特征数据中包含的每个数据项的融合特征重要度以及预设的特征重要度阈值,从每个维度特征数据中筛选若干个目标数据项;根据多个维度特征数据中筛选得到的多个目标数据项,预测所述目标用户的视频点击行为。
[0011]在一种可选的实现方式中,所述用户特征数据包括:用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据;
[0012]其中,所述用户属性特征数据包括:用户性别数据、用户年龄数据以及用户归属地
数据;所述用户行为特征数据包括:用户点击行为数据、用户浏览行为数据、用户点赞行为数据以及用户转发行为数据;所述视频特征数据包括视频类型特征数据、视频时长特征数据以及视频来源特征数据;所述网络特征数据包括终端类型特征数据、网络类型特征数据以及网络流量类型数据。
[0013]在一种可选的实现方式中,所述确定与所述用户特征数据相对应的多维组合特征数据,包括:
[0014]基于所述用户特征数据包含的用户行为特征数据以及视频特征数据,得到历史视频点击次数数据、和/或历史视频曝光量数据,并生成历史维度特征数据;以及
[0015]基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据以及视频特征数据,得到不同年龄段用户对不同类别的视频的点击次数数据、和/或不同年龄段用户在不同时间的视频点击次数数据,并生成交叉维度特征数据;以及
[0016]基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据,得到不同年龄段用户的视频观看总时长数据、和/或不同网络环境下的视频观看总时长数据,并生成统计维度特征数据;以及
[0017]基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据,得到用户年龄段的分布数据、和/或用户在不同网络环境下的视频点击数据,并生成离散维度特征数据;
[0018]根据得到的所述历史维度特征数据、交叉维度特征数据、统计维度特征数据以及离散维度特征数据,确定与所述用户特征数据相对应的多维组合特征数据。
[0019]在一种可选的实现方式中,根据所述第一特征重要度以及所述第二特征重要度,获取每个维度特征数据中包含的每个数据项的融合特征重要度,包括:
[0020]通过算术平均方式、调和平均方式、和/或几何平均方式对所述第一特征重要度以及所述第二特征重要度进行处理,得到所述融合特征重要度。
[0021]在一种可选的实现方式中,所述根据所述每个维度特征数据中包含的每个数据项的融合特征重要度以及预设的特征重要度阈值,从每个维度特征数据中筛选若干个目标数据项,包括:
[0022]获取每个维度特征数据中包含的每个数据项的融合特征重要度;
[0023]将融合特征重要度小于特征重要度阈值的数据项剔除,并将筛选后剩余的数据项作为目标数据项。
[0024]在一种可选的实现方式中,所述预设的特征重要度阈值包括:多个分别对应于每个维度特征数据的维度特征重要度阈值;
[0025]则所述将融合特征重要度小于预设的特征重要度阈值的数据项剔除,包括:
[0026]针对每个数据项,确定与该数据项的融合特征重要度对应的维度特征数据的维度特征重要度阈值;
[0027]若该数据项的融合特征重要度小于所述维度特征重要度阈值,则删除该数据项;
[0028]若该数据项的融合特征重要度不小于所述维度特征重要度阈值,则保留该数据项。
[0029]在一种可选的实现方式中,所述获取目标用户的用户特征数据包括:
[0030]获取目标用户的用户标识,获取与所述用户标识相对应的用户特征数据;其中,所
述用户标识包括:IP地址、和/或用户账号。
[0031]第二方面,本公开提供了一种视频点击行为的预测装置,包括:
[0032]获取模块,用于获取目标用户的用户特征数据,确定与所述用户特征数据相对应的多维组合特征数据;其中,所述多维组合特征数据包括多个维度特征数据,且每个维度特征数据中包含多个数据项;以及用于获取所述第一预测模型输出的与每个维度特征数据中包含的每个数据项的第一特征重要度,以及获取所述第二预测模型输出的与每个维度特征数据中包含的每个数据项的第二特征重要度;以及用于根据所述第一特征重要度以及所述第二特征重要度,获取每个维度特征数据中包含的每个数据项的融合特征重要度;
[0033]输入模块,用于将每个维度特征数据中包含的多个数据项分别输入第一预测模型以及第二预测模型;
[0034]筛选模块,用于根据所述每个维度特征数据中包含的每个数据项的融合特征重要度以及预设的特征重要度阈值,从每个维度特征数据中筛选若干个目标数据项;
[0035]预测模块,用于根据多个维度特征数据中筛选得到的多个目标数据项,预测所述目标用户的视频点击行为。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频点击行为的预测方法,其特征在于,包括:获取目标用户的用户特征数据,确定与所述用户特征数据相对应的多维组合特征数据;其中,所述多维组合特征数据包括多个维度特征数据,且每个维度特征数据中包含多个数据项;将每个维度特征数据中包含的多个数据项分别输入第一预测模型以及第二预测模型,获取所述第一预测模型输出的与每个维度特征数据中包含的每个数据项的第一特征重要度,以及获取所述第二预测模型输出的与每个维度特征数据中包含的每个数据项的第二特征重要度;根据所述第一特征重要度以及所述第二特征重要度,获取每个维度特征数据中包含的每个数据项的融合特征重要度;根据所述每个维度特征数据中包含的每个数据项的融合特征重要度以及预设的特征重要度阈值,从每个维度特征数据中筛选若干个目标数据项;根据多个维度特征数据中筛选得到的多个目标数据项,预测所述目标用户的视频点击行为。2.根据权利要求1所述的方法,其特征在于,所述用户特征数据包括:用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据;其中,所述用户属性特征数据包括:用户性别数据、用户年龄数据以及用户归属地数据;所述用户行为特征数据包括:用户点击行为数据、用户浏览行为数据、用户点赞行为数据以及用户转发行为数据;所述视频特征数据包括视频类型特征数据、视频时长特征数据以及视频来源特征数据;所述网络特征数据包括终端类型特征数据、网络类型特征数据以及网络流量类型数据。3.根据权利要求2所述的方法,其特征在于,所述确定与所述用户特征数据相对应的多维组合特征数据,包括:基于所述用户特征数据包含的用户行为特征数据以及视频特征数据,得到历史视频点击次数数据、和/或历史视频曝光量数据,并生成历史维度特征数据;以及基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据以及视频特征数据,得到不同年龄段用户对不同类别的视频的点击次数数据、和/或不同年龄段用户在不同时间的视频点击次数数据,并生成交叉维度特征数据;以及基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据,得到不同年龄段用户的视频观看总时长数据、和/或不同网络环境下的视频观看总时长数据,并生成统计维度特征数据;以及基于所述用户特征数据包含的用户属性特征数据、用户行为特征数据、视频特征数据以及网络特征数据,得到用户年龄段的分布数据、和/或用户在不同网络环境下的视频点击数据,并生成离散维度特征数据;根据得到的所述历史维度特征数据、交叉维度特征数据、统计维度特征数据以及离散维度特征数据,确定与所述用户特征数据相对应的多维组合特征数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征重要度以及所述第二特征重要度,获取每个维度特征数据中包含的每个数据项的融合特征重要度,包括:通过算术平均方式、调和平均方式、和/或几...

【专利技术属性】
技术研发人员:赵慧毋涛
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1