推荐多媒体文件的方法及装置制造方法及图纸

技术编号:15267511 阅读:102 留言:0更新日期:2017-05-04 02:11
本公开提供了一种推荐多媒体文件的方法及装置,属于互联网技术领域。方法包括:获取终端对应的第一多媒体文件的第一标签信息,第一标签信息为基于第一多媒体文件的第一字幕信息提取的;根据第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从多媒体文件库中选择第二标签信息与第一标签信息匹配的第二多媒体文件,每个第二多媒体文件的第二标签信息为基于每个第二多媒体文件的第二字幕信息提取的;向终端发送第二多媒体文件的标识。由于提取的第一标签信息和每个第二多媒体文件的第二标签信息较准确,根据第一标签信息和每个第二多媒体文件的第二标签信息,向用户推荐第二多媒体文件,能够提高向用户推荐第二多媒体文件的准确性。

Method and apparatus for recommending multimedia files

The invention discloses a method and a device for recommending multimedia files, which belongs to the technical field of the internet. The method includes: a first multimedia file acquiring terminal corresponding to the first label information, the first tag information for the first subtitle information extraction based on the first multimedia files; according to each of the first tag information and multimedia file library second multimedia files second label information, select the second label information with the first label information, second multimedia files from multimedia in each of the second libraries, second multimedia files tag information for each of the second subtitle information extraction based on second multimedia files; sending to the terminal second of the identification of the multimedia file. The extraction of the first label information and each of the second multimedia files second label information accurately, according to the first label information and each of the second multimedia files second label information, recommend second multimedia files to the user, can improve the accuracy of recommendation second multimedia files to users.

【技术实现步骤摘要】

本公开涉及互联网
,尤其涉及一种推荐多媒体文件的方法及装置
技术介绍
随着信息时代的到来,服务器中存储的视频文件越来越多;用户可以使用终端从服务器中获取用户感兴趣的视频文件。为了提高用户的体验,服务器还可以为用户推荐用户感兴趣的视频文件。目前,服务器在为用户推荐视频文件时,统计服务器中每个视频文件的点击率,根据每个视频文件的点击率,选择点击率最高的视频文件,向用户推荐选择的视频文件。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种推荐多媒体文件的方法及装置,所述技术方案如下:根据本公开实施例的第一方面,提供一种推荐多媒体文件的方法,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。在本公开实施例中,由于第一标签信息为基于第一多媒体文件的第一字幕信息提取的,每个第二多媒体文件的第二标签信息为基于每个第二多媒体文件的第二字幕信息提取的,因此提取的第一标签信息和每个第二多媒体文件的第二标签信息较准确,从而根据第一标签信息和每个第二多媒体文件的第二标签信息,向用户推荐第二多媒体文件,能够提高向用户推荐第二多媒体文件的准确性。在一种可能实现方式中,所述获取终端对应的第一多媒体文件的第一标签信息,包括:获取所述第一多媒体文件的第一字幕信息;对所述第一字幕信息进行分词,得到第一关键词集合;对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。在本公开实施例中,通过对第一多媒体文件的第一字幕信息进行语义分析,提取第一多媒体文件的第一标签信息,从而提高了第一标签信息的准确性。在一种可能实现方式中,所述对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息,包括:获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息;根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率;根据所述第一多媒体文件属于所述每个主题信息的概率,从所述每个主题信息中选择概率最大的预设数目个主题信息;将选择的预设数目个主题信息组成所述第一标签信息。在本公开实施例中,根据每个关键词在第一字幕信息中的概率和每个关键词属于每个主题信息的概率,确定第一多媒体文件属于每个主题信息的概率;根据第一多媒体文件属于每个主题信息的概率,从每个主题信息中选择概率最大的预设数目个主题信息,从而提高了第一标签信息的准确性。在一种可能实现方式中,所述根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,包括:将所述每个关键词在所述第一字幕信息中的概率组成第一概率矩阵,以及,将所述每个关键词属于每个主题信息的概率组成第二概率矩阵;将所述第二概率矩阵的逆矩阵与所述第一概率矩阵相乘,得到第三概率矩阵;从所述第三概率矩阵中获取所述第一多媒体文件属于所述每个主题信息的概率。在本公开实施例中,将每个关键词在第一字幕信息中的概率组成第一概率矩阵,将每个关键词属于每个主题信息的概率组成第二概率矩阵,根据第一概率矩阵和第二概率矩阵,确定第一多媒体文件属于每个主题信息的概率,提高了确定出第一多媒体文件属于每个主题信息的概率的准确性,进而提高了第一标签信息的准确性。在一种可能实现方式中,所述获取所述每个关键词属于主题信息库中的每个主题信息的概率,包括:对于所述每个主题信息,获取所述主题信息对应的预设关键词集合;根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率。在一种可能实现方式中,所述根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率,包括:如果所述预设关键词集合中包含所述每个关键词,将所述每个关键词在所述第一字幕信息中的概率和所述预设关键词集合包含的关键词的数目的比值作为所述每个关键词属于所述主题信息的概率;如果所述预设关键词集合中不包含所述每个关键词,确定所述每个关键词属于所述主题信息的概率为零。在本公开实施例中,将每个关键词在第一字幕信息中的概率和预设关键词集合包含的关键词的数目的比值作为每个关键词属于该主题信息的概率,由于结合了每个关键词在第一字幕信息中的概率,确定每个关键字属于该主题信息的概率,提高了确定出每个关键词属于该主题信息的概率的准确性,进而提高了第一标签信息的准确性。在一种可能实现方式中,所述对所述第一字幕信息进行分词,得到第一关键词集合,包括:对所述第一字幕信息进行分词,将所述第一字幕信息包括的每个分词组成第二关键词集合;将所述第二关键词集合中预设类型的关键词去除,得到所述第一关键字集合。在本公开实施例中,将第二关键词集合中预设类型的关键词去除,不仅降低了运算量,还提高了第一标签信息的准确性。在一种可能实现方式中,所述第一标签信息包括所述第一多媒体文件所属的主题信息、制作所述第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。在本公开实施例中,第一标签信息中包括第一多媒体文件所属的主题信息、制作第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。因此结合第一多媒体文件所属的主题信息、制作第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个为用户推荐第二多媒体文件,能够提高向用户推荐第二多媒体文件的准确性。根据本公开实施例的第二方面,提供一种推荐多媒体文件的装置,所述装置包括:获取模块,用于获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;选择模块,用于根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;发送模块,用于向所述终端发送所述第二多媒体文件的标识。在一种可能实现方式中,所述获取模块,包括:获取单元,用于获取所述第一多媒体文件的第一字幕信息;分词单元,用于对所述第一字幕信息进行分词,得到第一关键词集合;分析单元,用于对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。在一种可能实现方式中,所述分析单元,还用于获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息,根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,根据本文档来自技高网...
推荐多媒体文件的方法及装置

【技术保护点】
一种推荐多媒体文件的方法,其特征在于,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。

【技术特征摘要】
1.一种推荐多媒体文件的方法,其特征在于,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。2.根据权利要求1所述的方法,其特征在于,所述获取终端对应的第一多媒体文件的第一标签信息,包括:获取所述第一多媒体文件的第一字幕信息;对所述第一字幕信息进行分词,得到第一关键词集合;对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。3.根据权利要求2所述的方法,其特征在于,所述对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息,包括:获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息;根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率;根据所述第一多媒体文件属于所述每个主题信息的概率,从所述每个主题信息中选择概率最大的预设数目个主题信息;将选择的预设数目个主题信息组成所述第一标签信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,包括:将所述每个关键词在所述第一字幕信息中的概率组成第一概率矩阵,以及,将所述每个关键词属于每个主题信息的概率组成第二概率矩阵;将所述第二概率矩阵的逆矩阵与所述第一概率矩阵相乘,得到第三概率矩阵;从所述第三概率矩阵中获取所述第一多媒体文件属于所述每个主题信息的概率。5.根据权利要求3所述的方法,其特征在于,所述获取所述每个关键词属于主题信息库中的每个主题信息的概率,包括:对于所述每个主题信息,获取所述主题信息对应的预设关键词集合;根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率。6.根据权利要求5所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率,包括:如果所述预设关键词集合中包含所述每个关键词,将所述每个关键词在所述第一字幕信息中的概率和所述预设关键词集合包含的关键词的数目的比值作为所述每个关键词属于所述主题信息的概率;如果所述预设关键词集合中不包含所述每个关键词,确定所述每个关键词属于所述主题信息的概率为零。7.根据权利要求2所述的方法,其特征在于,所述对所述第一字幕信息进行分词,得到第一关键词集合,包括:对所述第一字幕信息进行分词,将所述第一字幕信息包括的每个分词组成第二关键词集合;将所述第二关键词集合中预设类型的关键词去除,得到所述第一关键字集合。8.根据权利要求1所述的方法,其特征在于,所述第一标签信息包括所述第一多媒体文件所属的主题信息、制作所述第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。9.一种推荐多媒体文件的装置,其特征在于,所述装置包括:获取模块,用于获取终端对应...

【专利技术属性】
技术研发人员:高阳丁晓亮刘爽
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1