一种基于影片剧情信息的相似度计算方法技术

技术编号:16873992 阅读:73 留言:0更新日期:2017-12-23 11:53
本发明专利技术实施例涉及一种基于影片剧情信息的相似度计算方法,包括:服务器在影片数据库中获取影片剧情信息;其中,影片数据库中包括多个影片ID和相对应的影片剧情信息;对剧情信息进行分词,得到影片ID对应的多个分词信息;在分词信息中提取预设数量的关键词信息;统计影片剧情信息中每个关键词信息的出现次数;选取出现次数大于预设次数的关键词信息;建立影片ID和关键词信息之间的关联关系,并储存;基于关键词信息根据预设规则计算影片相似度;对影片相似度进行排序,根据排序结果得到推荐影片;建立影片ID和推荐影片ID之间的关联关系,并储存。

A similarity calculation method based on the plot information of the film

The embodiment of the invention relates to a calculation method of similarity based on information including: the film plot server gets the film plot in the film information database; which comprises a plurality of ID films and the corresponding film film information database; information on the plot of words, get multiple segmentation information corresponding to the preset ID film; the number of keywords in the information extraction of word segmentation; number of occurrences of each keyword information statistical information in the film plot; selected times larger than the default number of key information; set a relationship between ID film and key word information and information storage; key words according to the preset rules to compute similarity based on ranking of the film; the film according to the similarity. The sorted results of recommended films; establish relationship between the movie and the movie ID ID recommended, and storage Deposit.

【技术实现步骤摘要】
一种基于影片剧情信息的相似度计算方法
本专利技术涉及视频
,尤其涉及一种基于影片剧情信息的相似度计算方法。
技术介绍
在用户通过视频网站观看视频时,视频网站通常会向用户推荐与用户当前观看的视频相关的视频。例如,当用户以非全屏模式观看视频时,可以在视频播放窗口的右侧和/或下侧显示与用户当前观看的视频相关的视频的信息。视频推荐效果的好坏主要根据点击率的高低来评判,通常,点击率越高,则视频推荐效果越好。视频推荐是基于影片相似度,目前计算影片相似度的主要方法为基于物品的协同过滤算法,或基于影片类型、影人、地域等属性的算法。协同过滤推荐是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。但是,基于协同过滤算法存在无法处理冷启动的问题,基于影片相关属性的算法存在颗粒度比较粗的不足,从而导致相似度计算不准确,进而导致推荐效果不理想。
技术实现思路
本专利技术的目的是针对现有技术的缺陷,提供一种基于影片剧情信息本文档来自技高网...
一种基于影片剧情信息的相似度计算方法

【技术保护点】
一种基于影片剧情信息的相似度计算方法,其特征在于,所述方法包括:服务器在影片数据库中获取影片剧情信息;其中,所述影片数据库中包括多个影片ID和相对应的影片剧情信息;对所述剧情信息进行分词,得到影片ID对应的多个分词信息;在所述分词信息中提取预设数量的关键词信息;统计所述影片剧情信息中每个关键词信息的出现次数;选取所述出现次数大于预设次数的关键词信息;建立所述影片ID和所述关键词信息之间的关联关系,并储存;基于所述关键词信息根据预设规则计算影片相似度;对所述影片相似度进行排序,根据排序结果得到推荐影片;建立影片ID和所述推荐影片ID之间的关联关系,并储存。

【技术特征摘要】
1.一种基于影片剧情信息的相似度计算方法,其特征在于,所述方法包括:服务器在影片数据库中获取影片剧情信息;其中,所述影片数据库中包括多个影片ID和相对应的影片剧情信息;对所述剧情信息进行分词,得到影片ID对应的多个分词信息;在所述分词信息中提取预设数量的关键词信息;统计所述影片剧情信息中每个关键词信息的出现次数;选取所述出现次数大于预设次数的关键词信息;建立所述影片ID和所述关键词信息之间的关联关系,并储存;基于所述关键词信息根据预设规则计算影片相似度;对所述影片相似度进行排序,根据排序结果得到推荐影片;建立影片ID和所述推荐影片ID之间的关联关系,并储存。2.根据权利要求1所述的基于影片剧情信息的相似度计算方法,其特征在于,在根据排序结果得到推荐影片之后,所述方法还包括:所述服务器接收用户终端发送的选择指令;其中,所述选择指令中包括目标影片ID;根据所述目标影片ID获取相关联的所述推荐影片ID;根据所述目标影片ID获取目标影片数据,并且根据所述推荐影片ID获取影片...

【专利技术属性】
技术研发人员:冯方方孙健刘斌付强
申请(专利权)人:环球智达科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1