一种生成视频元信息的方法和装置制造方法及图纸

技术编号:21361454 阅读:32 留言:0更新日期:2019-06-15 09:21
本申请公开了一种生成视频元信息的方法和装置,该方法包括:首先,基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;然后,根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;最后,基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。由此可见,基于搜索日志与目标视频相关的搜索词,采用预设过滤策略进行过滤,可以自动挖掘其中较为准确描述目标视频的搜索词作为目标视频元信息,该方案代替人工补充视频元信息的方式,简单、便捷、快速补充完善目标视频元信息,使得目标视频元信息较为完整、准确,从而优化后续视频搜索的召回效果,提升用户视频搜索的体验感受。

A Method and Device for Generating Video Element Information

This application discloses a method and device for generating video meta-information. The method includes: firstly, determining the search word set corresponding to the target video based on the click relationship between the target video in the search log and each search word; secondly, filtering each search word set in the search word set according to the preset filtering strategy to obtain the target search word set; lastly, based on the search word set. Each target search term in the tagged search term set generates meta-information of the target video. Therefore, based on search logs and target video-related search terms, a preset filtering strategy is adopted to filter the search terms, which can automatically mine the more accurate description of the target video as the target video meta-information. This scheme replaces the manual supplement of video meta-information. It is simple, convenient and fast to supplement and improve the target video meta-information, making the target video meta-information comparable. In order to be complete and accurate, so as to optimize the recall effect of follow-up video search, enhance the user's experience of video search.

【技术实现步骤摘要】
一种生成视频元信息的方法和装置
本申请涉及数据处理
,尤其涉及一种生成视频元信息的方法和装置。
技术介绍
随着科学技术的快速发展,视频数量大幅度增长,视频质量大幅度提高,在日常生活或者工作中浏览观看视频越来越普遍,用户通过可通过视频获取信息或休闲娱乐。其中,视频的一种重要获得方式是视频搜索,具体是利用视频搜索引擎基于视频的元信息进行搜索召回,而常见的视频标题、视频描述、视频标签等均可作为视频的元信息。目前,存储用于搜索召回的视频大多是由用户上传、全网抓取等方式得到的,通常大部分视频的元信息不完整、不准确,造成基于视频的元信息搜索召回这些视频的效果较差。现有技术中,通常是人工基于视频内容等信息对视频的元信息进行补充。但是,专利技术人经过研究发现,采用人工补充视频元信息的方式,人工补充难度较大、操作较复杂、效率较缓慢,且不能确保人工补充后的视频元信息完整、准确,导致后续视频搜索的召回效果并不稳定,用户视频搜索的体验感受较差。
技术实现思路
本申请所要解决的技术问题是,提供一种生成视频元信息的方法和装置,代替人工补充视频元信息的方式,简单、便捷、快速补充完善目标视频元信息,使得目标视频元信息较为完整、准确,从而优化后续视频搜索的召回效果,提升用户视频搜索的体验感受。第一方面,本申请实施例提供了一种生成视频元信息的方法,该方法包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。可选的,所述基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合,包括:基于所述搜索日志中目标视频与各个搜索词的点击关系,获得所述各个搜索词对应所述目标视频的点击次数;选取所述各个搜索词中对应所述目标视频的点击次数大于第一点击次数阈值的搜索词,确定所述目标视频对应的搜索词集合。可选的,所述预设过滤策略包括点击率阈值过滤策略和/或屏蔽词过滤策略和/或专名实体命中过滤策略。可选的,若所述预设过滤策略包括点击率阈值过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:基于所述目标视频与所述搜索词集合中各个搜索词的点击关系和展示关系,获得所述搜索词集合中各个搜索词对应所述目标视频的点击率;过滤所述搜索词集合中对应所述目标视频的点击率小于点击率阈值的搜索词,获得目标搜索词集合。可选的,若所述预设过滤策略包括屏蔽词过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:过滤所述搜索词集合中包括所述预设屏蔽词的搜索词,获得目标搜索词集合。可选的,若所述预设过滤策略包括专名实体命中过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:确定所述目标视频的视频标题包括的第一专名实体、所述第一专名实体对应白名单实体以及所述搜索词集合中各个搜索词包括的第二专名实体;基于所述第二专名实体与所述第一专名实体和所述第一专名实体对应白名单实体的重合数量,过滤所述搜索词集合中各个搜索词获得目标搜索词集合。可选的,所述第一专名实体对应白名单实体的生成步骤包括:基于所述搜索日志中用户与各个专名实体的搜索关系,获得搜索所述各个专名实体的用户数量,所述专名实体包括第一专名实体和至少一个其他专名实体;根据搜索所述各个专名实体的用户数量,获得所述第一专名实体与各个所述其他专名实体的协同过滤相关度;从所述至少一个其他专名实体中选取所述协同过滤相关度大于协同过滤相关度阈值的其他专名实体生成所述第一专名实体的白名单实体。可选的,若所述目标视频的视频标题包括人名实体,所述第一专名实体为第一人名实体,所述第二专名实体至少包括第二人名实体;若所述目标视频的视频标题包括剧名实体,所述第一专名实体为第一剧名实体,所述第二专名实体至少包括第二剧名实体。可选的,所述基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息,包括:确定所述目标搜索词集合中各个目标搜索词对应所述目标视频的点击次数;基于所述各个目标搜索词对应所述目标视频的点击次数,选取所述目标搜索词集合中各个目标搜索词生成所述目标视频的元信息。可选的,所述基于所述各个目标搜索词对应所述目标视频的点击次数,选取所述目标搜索词集合中各个目标搜索词生成所述目标视频的元信息,包括:基于所述各个目标搜索词对应所述目标视频的点击次数,按照从大到小顺序排序所述目标搜索词集合中各个目标搜索词;选取排序后的前N个目标搜索词,生成所述目标视频的元信息,所述N为小于所述目标搜索词集合中目标搜索词数量的正整数。可选的,所述基于所述各个目标搜索词对应所述目标视频的点击次数,选取所述目标搜索词集合中各个目标搜索词生成所述目标视频的元信息,具体为:从所述各个目标搜索词中选取对应所述目标视频的点击次数大于第二点击次数阈值的目标搜索词,生成所述目标视频的元信息,所述第二点击次数阈值大于所述第一点击次数阈值。第二方面,本申请实施例提供了一种生成视频元信息的装置,该装置包括:确定单元,用于基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;获得单元,用于根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;生成单元,用于基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。与现有技术相比,本申请至少具有以下优点:采用本申请实施例的技术方案,首先,基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;然后,根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;最后,基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。由此可见,基于搜索日志与目标视频相关的搜索词,采用预设过滤策略进行过滤,可以自动挖掘其中较为准确描述目标视频的搜索词作为目标视频元信息,该方案代替人工补充视频元信息的方式,简单、便捷、快速补充完善目标视频元信息,使得目标视频元信息较为完整、准确,从而优化后续视频搜索的召回效果,提升用户视频搜索的体验感受。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例中一种应用场景所涉及的系统框架示意图;图2为本申请实施例提供的一种生成视频元信息的方法的流程示意图;图3为本申请实施例提供的一种生成视频元信息的装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。现阶段,日常生活或者工作中搜索召回视频获取信息或休闲娱乐越来越普遍。一般的,存储用于搜索召回的视频大多是由用户上传、全本文档来自技高网
...

【技术保护点】
1.一种生成视频元信息的方法,其特征在于,包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。

【技术特征摘要】
1.一种生成视频元信息的方法,其特征在于,包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。2.根据权利要求1所述的方法,其特征在于,所述基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合,包括:基于所述搜索日志中目标视频与各个搜索词的点击关系,获得所述各个搜索词对应所述目标视频的点击次数;选取所述各个搜索词中对应所述目标视频的点击次数大于第一点击次数阈值的搜索词,确定所述目标视频对应的搜索词集合。3.根据权利要求1所述的方法,其特征在于,所述预设过滤策略包括点击率阈值过滤策略和/或屏蔽词过滤策略和/或专名实体命中过滤策略。4.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括点击率阈值过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:基于所述目标视频与所述搜索词集合中各个搜索词的点击关系和展示关系,获得所述搜索词集合中各个搜索词对应所述目标视频的点击率;过滤所述搜索词集合中对应所述目标视频的点击率小于点击率阈值的搜索词,获得目标搜索词集合。5.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括屏蔽词过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:过滤所述搜索词集合中包括所述预设屏蔽词的搜索词,获得目标搜索词集合。6.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括专名实体命中过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:确定所述目标视频的视频标题包括的第一专名实体、所述第一专名实体对应白名单实体以及所述搜索词集合中各个搜索词包括的第二专名实体;基于所述第二专名实体与所述第一专名实体和所述第一专名实体对应白名单实体的重合数量,过滤所述搜索词集合中各个搜索词获得目标搜索词集合。7.根据权利要求6所述的方法,其特征在于,所述第一专名实体对应白名单实体的生成步骤包括:基于所述搜索日志中用户与各个专名实体的搜索关系,获...

【专利技术属性】
技术研发人员:叶澄灿陈英傑王天畅
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1