度量用户的视频偏好的方法、系统及计算机可读存储介质技术方案

技术编号:18530563 阅读:69 留言:0更新日期:2018-07-25 15:16
本发明专利技术提供了一种用于度量用户的视频偏好的方法,包括以下步骤:获取用户在预设时间段内的每次观看的视频的记录;根据所述记录,统计得到所述每次观看的视频的属性信息,所述属性信息包括视频标签;利用属性信息计算所述每次观看的视频的威尔逊区间下限值,并由此计算所述视频标签的用户偏好值。本发明专利技术还提供了一种用于度量用户的视频偏好的系统以及一种相关的计算机可读存储介质。

【技术实现步骤摘要】
度量用户的视频偏好的方法、系统及计算机可读存储介质
本专利技术涉及视频推荐领域,具体涉及一种度量用户的视频偏好的方法、相应的系统以及相关计算机可读存储介质。
技术介绍
在视频推荐领域中,为了让推荐的结果更加具有个性化,需要形成准确的用户标签偏好。通过文本挖掘或者其他的一些方法,我们可以得到一个视频所包含的标签以及权重,如某个视频包含标签A和标签B,其权重分别是0.5和0.3。如果一个用户对某个视频很感兴趣,那么可以推定用户对该视频所包含的标签也是感兴趣的,因此一个难点问题是如何通过已知的视频标签和用户的观看行为得到用户对各标签的偏好。通常得到用户标签偏好的方法主要是根据简单的统计,计算用户对各标签下的视频观看次数或者时长,根据这些统计指标确定用户对标签的偏好。然而,这样做的缺点有如下几点:一是单一指标有局限性,无法准确刻画用户的真实兴趣;二是没有考虑视频包含不同标签的权重,简单地认为所有标签的权重都是一样的。因此,有必要提出一种新的度量用户的视频偏好的方法及系统。
技术实现思路
有鉴于此,为了克服上述问题的至少一个方面,本专利技术实施例提供一种度量用户的视频偏好的方法及系统。根据本专利技术的一个方面,提供了一种度量用户的视频偏好的方法,包括步骤:S1,获取用户在预设时间段内的每次观看的视频的记录;S2,根据所述记录,统计得到所述每次观看的视频的属性信息,所述属性信息包括视频标签;S3,利用步骤S2得到的属性信息计算所述每次观看的视频的威尔逊区间下限值,并由此计算所述视频标签的用户偏好值。进一步地,所述步骤S1进一步包括:将所述预设时间段内每次观看的视频构成视频集合V={vi},1≤i≤n,n为所述用户在所述预设时间段内观看视频的总次数。进一步地,所述视频集合V中的每一个视频vi具有至少一个视频标签,其中,所述至少一个视频标签中的每一个视频标签均具有预设的权重。例如,所述属性信息还包括每次观看的视频vi的总时长和用户实际观看时长。进一步地,所述步骤S2包括:提取所述视频集合V中的所有不同的视频标签,构成视频标签集合T={tj},1≤j≤m,m为所述所有不同的视频标签的总数目。进一步地,所述步骤S3包括以下步骤:S31:根据所述每次观看的视频vi的总时长和所述用户实际观看时长计算所述每次观看的视频vi的威尔逊区间下限值;S32:计算用户对视频标签集合T中的视频标签tj的偏好值。例如,根据下式计算威尔逊区间下限值:其中,为每次观看的视频vi的总时长,表示用户对视频vi的实际观看时长,p为所述用户实际观看时长和所述每次观看的视频vi的总时长的比值,即α表示置信水平,z1-α/2表示在置信水平α下的z统计量。例如,根据下式计算用户对视频标签集合T中的视频标签tj的偏好值:其中,是用户对视频标签tj的偏好值;是视频标签tj在所述每次观看的视频vi中的预设权重,若视频vi不含视频标签tj,则该值为0;是用户在所述预设时间段内对含有视频标签tj的视频的观看总次数。根据本专利技术的另一方面,提供了一种用于度量用户的视频偏好的系统,包括:获取模块,用于获取用户在预设时间段内的每次观看的视频的记录;统计模块,用于根据所述记录,统计所述每次观看的视频的属性信息,所述属性信息包括视频标签、所述每次观看的视频的总时长和用户实际观看时长;计算模块,用于根据所述属性信息计算得到的所述每次观看的视频的威尔逊区间下限值,并由此计算对所述视频标签的用户偏好值。例如,所述获取模块包括第一数据处理模块,用于将所述预设时间段内每次观看的视频构成视频集合V={vi},1≤i≤n,n为所述用户在所述预设时间段内观看视频的总次数。例如,所述视频集合V中的每一个视频vi具有至少一个视频标签,其中,所述至少一个视频标签中的每一个视频标签均具有预设的权重。进一步地,所述统计模块还包括第二数据处理模块,用于提取所述视频集合V中的所有不同的视频标签,构成视频标签集合T={tj},1≤j≤m,m为所述所有不同的视频标签的总数目。进一步地,所述计算模块包括:第一计算模块,用于根据所述每次观看的视频vi的总时长和所述用户实际观看时长计算所述每次观看的视频vi的威尔逊区间下限值;第二计算模块,用于基于所述每次观看的视频vi的威尔逊区间下限值,计算用户对视频标签集合T中的视频标签tj的偏好值。例如,所述第一计算模块根据下式计算所述每次观看的视频vi的威尔逊区间下限值:其中,为每次观看的视频vi的总时长,表示用户对视频vi的实际观看时长,p为所述用户实际观看时长和所述每次观看的视频vi的总时长的比值,即α表示置信水平,z1-α/2表示在置信水平α下的z统计量。例如,所述第二计算模块根据下式计算所述视频标签集合T中视频标签tj的用户偏好值:其中,是用户对视频标签tj的偏好值;是所述每次观看的视频vi中视频标签tj的预设权重,若视频vi不含视频标签tj,则该值为0;是用户在所述预设时间段内对含有视频标签tj的视频的观看总次数。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的任一种用于度量用户的视频偏好的方法的步骤。与现有技术相比,本专利技术具有以下优点:本专利技术提出一种基于威尔逊区间的用户视频标签偏好度量方法,综合考虑观看次数、观看完成率以及标签权重对用户视频标签偏好的影响,更具有全面性和科学性,能准确地对用户的标签偏好进行量化。附图说明通过下文中参照附图对本专利技术所作的描述,本专利技术的其它目的和优点将显而易见,并可帮助对本专利技术有全面的理解。图1为度量用户的视频偏好的方法实施步骤的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例的附图,对本专利技术的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术的一个实施例,而不是全部的实施例。基于所描述的本专利技术的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。除非另外定义,本专利技术使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。根据本专利技术的一个方面,提供了一种基于威尔逊空间的度量用户的视频偏好的方法,包括以下步骤:获取用户在预设时间段内的每次观看的视频的记录;根据所述记录,统计得到所述每次观看的视频的属性信息,所述属性信息包括视频标签、所述每次观看的视频的总时长和所述用户实际观看时长;利用所述每次观看的视频的总时长和所述用户实际观看时长计算所述每次观看的视频的威尔逊区间下限值,并由此计算所述视频标签的用户偏好值。更具体的,下面结合附图对本专利技术基于威尔逊空间的度量用户的视频偏好的方法进行详细的描述。参考图1所示,本专利技术实施例提供的基于威尔逊空间的度量用户的视频偏好的方法,包括如下步骤:步骤S1:获取用户在预设时间段内的每次观看的视频的记录。在本实施例中,预设时间段可以是7天。当然在其他实施例中,也可以是其他时间长度,比如可以为更长的时间长度,例如30天,还可以为较短的时间长度,例如数小时。在本实施例中,步骤S1,可以进一步包括将所述预设时间段内每次观看的视频构成视频集合V={vi},1≤i≤n,n为所述用户在所述预设时间段内观看视频的总次数。需要说明的是,用户在预设时间段内每次观看本文档来自技高网...

【技术保护点】
1.一种用于度量用户的视频偏好的方法,包括以下步骤:S1,获取用户在预设时间段内的每次观看的视频的记录;S2,根据所述记录,统计得到所述每次观看的视频的属性信息,所述属性信息包括视频标签;S3,利用步骤S2得到的属性信息计算所述每次观看的视频的威尔逊区间下限值,并由此计算所述视频标签的用户偏好值。

【技术特征摘要】
1.一种用于度量用户的视频偏好的方法,包括以下步骤:S1,获取用户在预设时间段内的每次观看的视频的记录;S2,根据所述记录,统计得到所述每次观看的视频的属性信息,所述属性信息包括视频标签;S3,利用步骤S2得到的属性信息计算所述每次观看的视频的威尔逊区间下限值,并由此计算所述视频标签的用户偏好值。2.如权利要求1所述的方法,其特征在于,所述步骤S1进一步包括:将所述预设时间段内每次观看的视频构成视频集合V={vi},1≤i≤n,n为所述用户在所述预设时间段内观看视频的总次数。3.如权利要求2所述的方法,其特征在于,所述视频集合V中的每一个视频vi具有至少一个视频标签,其中,所述至少一个视频标签中的每一个视频标签均具有预设的权重。4.如权利要求2所述的方法,其特征在于,所述属性信息还包括每次观看的视频vi的总时长和用户实际观看时长。5.如权利要求4所述的方法,其特征在于,所述步骤S2进一步包括:提取所述视频集合V中的所有不同的视频标签,构成视频标签集合T={tj},1≤j≤m,m为所述所有不同的视频标签的总数目。6.如权利要求5所述的方法,其特征在于,所述步骤S3进一步包括以下步骤:S31:根据所述每次观看的视频vi的总时长和所述用户实际观看时长计算所述每次观看的视频vi的威尔逊区间下限值;S32:计...

【专利技术属性】
技术研发人员:王璐张文明陈少杰
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1