The invention discloses a method and a device for recommending multimedia files, which belongs to the technical field of the internet. The method includes: a first multimedia file acquiring terminal corresponding to the first label information, the first tag information for the first subtitle information extraction based on the first multimedia files; according to each of the first tag information and multimedia file library second multimedia files second label information, select the second label information with the first label information, second multimedia files from multimedia in each of the second libraries, second multimedia files tag information for each of the second subtitle information extraction based on second multimedia files; sending to the terminal second of the identification of the multimedia file. The extraction of the first label information and each of the second multimedia files second label information accurately, according to the first label information and each of the second multimedia files second label information, recommend second multimedia files to the user, can improve the accuracy of recommendation second multimedia files to users.
【技术实现步骤摘要】
本公开涉及互联网
,尤其涉及一种推荐多媒体文件的方法及装置。
技术介绍
随着信息时代的到来,服务器中存储的视频文件越来越多;用户可以使用终端从服务器中获取用户感兴趣的视频文件。为了提高用户的体验,服务器还可以为用户推荐用户感兴趣的视频文件。目前,服务器在为用户推荐视频文件时,统计服务器中每个视频文件的点击率,根据每个视频文件的点击率,选择点击率最高的视频文件,向用户推荐选择的视频文件。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种推荐多媒体文件的方法及装置,所述技术方案如下:根据本公开实施例的第一方面,提供一种推荐多媒体文件的方法,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。在本公开实施例中,由于第一标签信息为基于第一多媒体文件的第一字幕信息提取的,每个第二多媒体文件的第二标签信息为基于每个第二多媒体文件的第二字幕信息提取的,因此提取的第一标签信息和每个第二多媒体文件的第二标签信息较准确,从而根据第一标签信息和每个第二多媒体文件的第二标签信息,向用户推荐第二多媒体文件,能够提高向用户推荐第二多媒体文件的准确性。在一种可能实现方式中,所述获取终端对应的第一多媒体文件的第一标签信息,包括:获取所述第一多 ...
【技术保护点】
一种推荐多媒体文件的方法,其特征在于,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。
【技术特征摘要】
1.一种推荐多媒体文件的方法,其特征在于,所述方法包括:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;向所述终端发送所述第二多媒体文件的标识。2.根据权利要求1所述的方法,其特征在于,所述获取终端对应的第一多媒体文件的第一标签信息,包括:获取所述第一多媒体文件的第一字幕信息;对所述第一字幕信息进行分词,得到第一关键词集合;对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。3.根据权利要求2所述的方法,其特征在于,所述对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息,包括:获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息;根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率;根据所述第一多媒体文件属于所述每个主题信息的概率,从所述每个主题信息中选择概率最大的预设数目个主题信息;将选择的预设数目个主题信息组成所述第一标签信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,包括:将所述每个关键词在所述第一字幕信息中的概率组成第一概率矩阵,以及,将所述每个关键词属于每个主题信息的概率组成第二概率矩阵;将所述第二概率矩阵的逆矩阵与所述第一概率矩阵相乘,得到第三概率矩阵;从所述第三概率矩阵中获取所述第一多媒体文件属于所述每个主题信息的概率。5.根据权利要求3所述的方法,其特征在于,所述获取所述每个关键词属于主题信息库中的每个主题信息的概率,包括:对于所述每个主题信息,获取所述主题信息对应的预设关键词集合;根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率。6.根据权利要求5所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率,包括:如果所述预设关键词集合中包含所述每个关键词,将所述每个关键词在所述第一字幕信息中的概率和所述预设关键词集合包含的关键词的数目的比值作为所述每个关键词属于所述主题信息的概率;如果所述预设关键词集合中不包含所述每个关键词,确定所述每个关键词属于所述主题信息的概率为零。7.根据权利要求2所述的方法,其特征在于,所述对所述第一字幕信息进行分词,得到第一关键词集合,包括:对所述第一字幕信息进行分词,将所述第一字幕信息包括的每个分词组成第二关键词集合;将所述第二关键词集合中预设类型的关键词去除,得到所述第一关键字集合。8.根据权利要求1所述的方法,其特征在于,所述第一标签信息包括所述第一多媒体文件所属的主题信息、制作所述第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。9.一种推荐多媒体文件的装置,其特征在于,所述装置包括:获取模块,用于获取终端对应...
【专利技术属性】
技术研发人员:高阳,丁晓亮,刘爽,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。