The invention is applicable to the field of information processing, provides a video program recommendation method and device, including: obtaining a plurality of video programs, the plurality of video programs including the first video program and a plurality of second video programs, the first video program for the user last watch video, second video programs to be recommended program each program gets attribute; video program value; according to each attribute value, calculated the similarity between the first and second video programs each video program; the similarity of one of the largest second video program recommendation to the user. In the invention, the recommended program can maximally conform to the current interest of the user and improve the accuracy of the recommendation of the video program. Because without the video content into structured data, thus reducing the possibility of concrete, calculation complexity and calculation error, thereby improving the efficiency of the recommended program, to meet the actual needs of users of the program recommended.
【技术实现步骤摘要】
一种视频节目推荐方法及视频节目推荐装置
本专利技术属于信息处理领域,尤其涉及一种视频节目推荐方法及视频节目推荐装置。
技术介绍
基于内容的推荐算法(Content-basedRecommendations,CB)是目前最流行的一种推荐方法。它根据用户过去喜欢的产品(item),为用户推荐与之相似的其他产品。例如,一个推荐饭店的系统可以依据某个用户之前喜欢的多个烤肉店,从而为他推荐其他烤肉店。在真实的应用场景中,每个item往往都会有一些可以描述其特征内容的属性。这些属性通常可以分为两种:结构化的属性与非结构化的属性。包含结构化属性的数据可以直接被分析处理,但是,对于包含非结构化属性的数据而言,例如一篇文章数据,则先要把它转化为结构化属性的数据后,才能加以分析使用。由于CB算法并非专门应用于视频节目的推荐算法,因此,根据CB算法的原理来推荐视频节目,则需要先将视频节目的内容转化为具体的结构化数据。在该过程中,由于视频节目的内容复杂,视频画面变化多端,因此,计算复杂度过大,容易出现误差,从而导致视频节目推荐的效果难以满足用户的实际需求。
技术实现思路
本专利技术实施例的目的在于提供一种视频节目推荐方法及视频节目推荐装置,旨在解决现有视频节目推荐方法中计算复杂度过大,容易出现误差,从而导致视频节目推荐的效果难以满足用户实际需求的问题。本专利技术实施例是这样实现的,一种视频节目推荐方法,包括:获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;获取每个所述视频节目中各节目属 ...
【技术保护点】
一种视频节目推荐方法,其特征在于,包括:获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;获取每个所述视频节目中各节目属性的属性值;根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;将所述相似度最大的一个所述第二视频节目输出为推荐节目。
【技术特征摘要】
1.一种视频节目推荐方法,其特征在于,包括:获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;获取每个所述视频节目中各节目属性的属性值;根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;将所述相似度最大的一个所述第二视频节目输出为推荐节目。2.如权利要求1所述的方法,其特征在于,所述节目属性包括以下至少一项:导演属性、演员属性、编剧属性、片名属性、类型属性、国家属性、语言属性以及年份属性。3.如权利要求1或2所述的方法,其特征在于,所述根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度包括:对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度;将计算得到的各个所述节目属性对应的所述属性值相似度进行加权处理,得到该第二视频节目与所述第一视频节目的相似度。4.如权利要求3所述的方法,其特征在于,所述对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度包括:当相同节目属性为可向量化的节目属性时,对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词;在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量;计算第一特征向量与第二特征向量之间的余弦相似度,所述第一特征向量与所述第二特征向量为所述相同节目属性在所述第一视频节目与该第二视频节目中的所述属性值所分别对应的所述特征向量;将所述余弦相似度输出为该第二视频节目与所述第一视频节目之间所述相同节目属性的属性值相似度。5.如权利要求4所述的方法,其特征在于,当相同节目属性为可向量化的节目属性时,所述对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词包括:对于所述相同节目属性分别在所述第一视频节目与该第二视频节目中的每个所述属性值,当该属性值中包含有标点符号时,以所述标点符号为分词拆分点,对该属性值进行分词,以得到该属性值对应的多个分词;当该属性值中未包含有任何标点符号时,获取预设的标准词库中的各个词语;判断该属性值是否包含所述标准词库中的至少一个所述词语;若该属性值包含所述标准词库中的至少一个所述词语,则将其包含的每个词语作为该属性值对应的多个分词。6.如权利要求4所述的方法,其特征在于,所述在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重包括:在一个所述属性值对应的多个分词中,依照每个所述分词在该属性值中出现的先后次序,对各个分词进行排序,以得到分词序列;在所述分词序列中,若存在包含有至少两个相同起始字符的两个分词,则将其中字符长度较大的分词排在字符长度较小的分词前面;依照所述分词的排序顺序,为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;生成权重列表,所述权重列表包含每个所述分词对应的所述权重。7.如权利要求6所述的方法,其特征在于,所述在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量包括:在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量,所述特征向量中的每个元素值依次为所述权重列表中每个所述分词对应的所述权重。8.如权利要求3所述的方法,其特征在于,所述对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度包括:当相同节目属性为不可向量化的节目属性时,通过预设公式计算该第二视频节目与所述第一视频节目之间不可向量化的所...
【专利技术属性】
技术研发人员:黄宇殊,李延平,潘小兵,
申请(专利权)人:UT斯达康深圳技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。