相似影片的计算方法技术

技术编号:32435597 阅读:28 留言:0更新日期:2022-02-24 19:09
本发明专利技术相似影片的计算方法,涉及影片推荐技术领域,通过协同过滤算法或者swing算法获得影片的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度,对所述相似度进行归一化处理,获得初级相似影片的第二相似度,将初级相似影片的信息元素作为所述影片的初始标签,利用第二相似度获得每个初始标签的权重,将权重大于预设值的初始标签作为所述影片的隐式标签,由此,计算影片库中所有影片的隐式标签,再结合影片的隐式标签,计算影片库中的某一部影片与其他影片的第三相似度,根据第三相似度,选出所述某一部影片的相似影片,解决了现有的相似影片计算方法获得的相似影片的准确度低的问题,本发明专利技术适用于计算相似影片。用于计算相似影片。用于计算相似影片。

【技术实现步骤摘要】
相似影片的计算方法


[0001]本专利技术涉及影片推荐
,特别涉及相似影片的计算方法。

技术介绍

[0002]随着影视行业与科技的迅猛发展,现在的影视平台有各式各样的影片供人们选择观看,人们可以自主选择,也可以让推荐系统帮忙推荐,如果选择后者,那就要求推荐系统推荐出来的影片与人们之前观看过的影片具有相关性,人们才会买单。因此,计算一部影片的相似影片成为评判推荐系统好坏的关键一环。
[0003]现有技术中,比较常用的相似影片计算方法有两种,分别是基于用户行为计算和基于影片内容计算。基于用户行为的算法能够发掘出看过某部影片的人还喜欢看哪些影片;而基于影片内容计算出的相似影片则是那些具有相同类型、演员等的影视作品。两种方法计算获得的相似影片的准确性低。

技术实现思路

[0004]本专利技术所解决的技术问题:提供一种相似影片的计算方法,解决现有的相似影片计算方法获得的相似影片的准确度低的问题。
[0005]本专利技术解决上述技术问题采用的技术方案:相似影片的计算方法,包括以下步骤:
[0006]S01、获取影片的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度;
[0007]S02、对相似度进行归一化处理,获得每一个初级相似影片的第二相似度;
[0008]S03、将初级相似影片的信息元素作为所述影片的初始标签,获得所述影片的初始标签集合;
[0009]S04、利用第二相似度计算每一个初始标签的权重;
[0010]S05、将初始标签集合中权重大于预设值的初始标签作为所述影片的隐式标签;
[0011]S06、重复步骤S01至S05,计算影片库中所有影片的隐式标签;
[0012]S07、结合影片的隐式标签,计算影片库中的某一部影片与其他影片的第三相似度;
[0013]S08、根据第三相似度,选出所述某一部影片的相似影片。
[0014]进一步的,步骤S01中,通过协同过滤算法获得相似影片集合和所述影片与相似影片集合中的每一个相似影片的相似度。
[0015]进一步的,步骤S01中,通过swing算法获得相似影片集合和所述影片与相似影片集合中的每一个相似影片的相似度。
[0016]进一步的,步骤S03中,所述相似影片的信息元素包括演员、导演、类型和关键词。
[0017]进一步的,步骤S04中,包含初始标签的所有相似影片的第二相似度的和为所述初始标签的权重。
[0018]进一步的,步骤S07中,所述第三相似度的计算方法包括以下步骤:
[0019]S701、获取所述某一部影片和另一部影片的基本信息,所述基本信息包括信息类别和信息类别对应的内容,所述信息类别包括步骤S06获得的影片的隐式标签;
[0020]S702、根据信息类别对应的内容将信息类别分为单元素信息类别和多元素信息类别;
[0021]对于多元素信息类别,两部影片同一信息类别对应的元素个数的最小值记为min,其中相同的元素个数记为intersection,利用公式Score=intersection
×
k
÷
min获得该信息类别的得分Score,所述公式中的k为常数,分别计算所有多元素的信息类别的得分;
[0022]对于单元素信息类别,若两部影片同一单元素信息类别对应的元素相同,则该单元素信息类别得分,所得分数为预定值;
[0023]S703、将信息类别得分相加,获得所述另一部影片与所述某一部影片的第三相似度。
[0024]进一步的,步骤S701中,所述影片的信息类别还包括演员列表、导演、编剧、剧组人员、简介、发布日期、时长、地区、评分、出版方、标题和语言中的一种或多种。
[0025]进一步的,步骤S702中,对于不同的单元素信息素类别,所述预定值不一定相同。
[0026]进一步的,步骤S08中,将其他影片按照第三相似度的大小顺序排列,选取排名前N部影片作为所述某一部影片的相似影片,所述N为大于1的正整数。
[0027]进一步的,步骤S08中,选出第三相似度大于设定值的其他影片作为所述某一部影片的相似影片。
[0028]本专利技术的有益效果:本专利技术相似影片的计算方法,通过协同过滤算法或者swing算法获得影片的基于用户行为的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度,然后对所述相似度进行归一化处理,获得初级相似影片的第二相似度,将初级相似影片的信息元素作为所述影片的初始标签,并利用第二相似度获得每个初始标签的权重,将权重大于预设值的初始标签作为所述影片的隐式标签,由此,计算影片库中所有影片的隐式标签,再结合影片的隐式标签,计算影片库中的某一部影片与其他影片的第三相似度,根据第三相似度,选出所述某一部影片的相似影片,本专利技术结合了用户行为与影片内容进行相似影片计算,解决了现有的相似影片计算方法获得的相似影片的准确度低的问题。
附图说明
[0029]附图1是本专利技术相似影片的计算方法的流程示意图。
具体实施方式
[0030]本专利技术相似影片的计算方法,如附图1所示,包括以下步骤:
[0031]S01、获取影片的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度;
[0032]具体的,通过协同过滤算法或者swing算法获得影片的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度。比如:已知某影片V,通过协同过滤算法或者swing算法在影片库中找到与所述影片V的初级相似影片和相似度,将获得的初级相似影片按照相似度从大到小的顺序进行排列,选取排名前20的相似影片作为相似
影片集合中的元素,即获得初级相似影片V1、V2、V3

V20,相似影片集合中选取的相似影片个数根据实际情况设定。
[0033]S02、对相似度进行归一化处理,获得每一个初级相似影片的第二相似度;
[0034]具体的,将20部初级相似影片中相似度最高的作为分母,初级相似影片的相似度作为分子,获得初级相似影片集合中的每一个初级相似影片的第二相似度,所述第二相似度不大于1。
[0035]S03、将初级相似影片的信息元素作为所述影片的初始标签,获得所述影片的初始标签集合;
[0036]具体的,所述相似影片的信息元素包括演员、导演、类型和关键词。
[0037]S04、利用第二相似度计算每一个初始标签的权重;
[0038]具体的,包含初始标签的所有相似影片的第二相似度的和为所述初始标签的权重,例如:影片V与相似影片V1、V2、V3的相似度分别为0.9、0.8、0.7;V1的信息元素有a和b,V2的信息元素有b和c,V3的信息元素有a和d,V4到V20中没有信息元素a,b,c和d;那么,信息元素a,b,c和d都是所述影片的初始标签,初始标签a的权重为0.9+0.7=1.6;初始标签b的权重为0.9+0.8=1.7本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.相似影片的计算方法,其特征在于,包括以下步骤:S01、获取影片的初级相似影片集合和所述影片与初级相似影片集合中的每一个初级相似影片的相似度;S02、对相似度进行归一化处理,获得每一个初级相似影片的第二相似度;S03、将初级相似影片的信息元素作为所述影片的初始标签,获得所述影片的初始标签集合;S04、利用第二相似度计算每一个初始标签的权重;S05、将初始标签集合中权重大于预设值的初始标签作为所述影片的隐式标签;S06、重复步骤S01至S05,计算影片库中所有影片的隐式标签;S07、结合影片的隐式标签,计算影片库中的某一部影片与其他影片的第三相似度;S08、根据第三相似度,选出所述某一部影片的相似影片。2.根据权利要求1所述的相似影片的计算方法,其特征在于,步骤S01中,通过协同过滤算法获得相似影片集合和所述影片与相似影片集合中的每一个相似影片的相似度。3.根据权利要求1所述的相似影片的计算方法,其特征在于,步骤S01中,通过swing算法获得相似影片集合和所述影片与相似影片集合中的每一个相似影片的相似度。4.根据权利要求1

3任一项所述的相似影片的计算方法,其特征在于,步骤S03中,所述相似影片的信息元素包括演员、导演、类型和关键词。5.根据权利要求1

3任一项所述的相似影片的计算方法,其特征在于,步骤S04中,包含初始标签的所有相似影片的第二相似度的和为所述初始标签的权重。6.根据权利要求1

3任一项所述的相似影片的计算方法,其特征在于,步骤S07中,所述第三相似度的计算方法包括以下步骤:S701、获取所述某一部影片和另一部...

【专利技术属性】
技术研发人员:马荣深吴上波
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1