This application discloses a method and device for generating video meta-information. The method includes: firstly, determining the search word set corresponding to the target video based on the click relationship between the target video in the search log and each search word; secondly, filtering each search word set in the search word set according to the preset filtering strategy to obtain the target search word set; lastly, based on the search word set. Each target search term in the tagged search term set generates meta-information of the target video. Therefore, based on search logs and target video-related search terms, a preset filtering strategy is adopted to filter the search terms, which can automatically mine the more accurate description of the target video as the target video meta-information. This scheme replaces the manual supplement of video meta-information. It is simple, convenient and fast to supplement and improve the target video meta-information, making the target video meta-information comparable. In order to be complete and accurate, so as to optimize the recall effect of follow-up video search, enhance the user's experience of video search.
【技术实现步骤摘要】
一种生成视频元信息的方法和装置
本申请涉及数据处理
,尤其涉及一种生成视频元信息的方法和装置。
技术介绍
随着科学技术的快速发展,视频数量大幅度增长,视频质量大幅度提高,在日常生活或者工作中浏览观看视频越来越普遍,用户通过可通过视频获取信息或休闲娱乐。其中,视频的一种重要获得方式是视频搜索,具体是利用视频搜索引擎基于视频的元信息进行搜索召回,而常见的视频标题、视频描述、视频标签等均可作为视频的元信息。目前,存储用于搜索召回的视频大多是由用户上传、全网抓取等方式得到的,通常大部分视频的元信息不完整、不准确,造成基于视频的元信息搜索召回这些视频的效果较差。现有技术中,通常是人工基于视频内容等信息对视频的元信息进行补充。但是,专利技术人经过研究发现,采用人工补充视频元信息的方式,人工补充难度较大、操作较复杂、效率较缓慢,且不能确保人工补充后的视频元信息完整、准确,导致后续视频搜索的召回效果并不稳定,用户视频搜索的体验感受较差。
技术实现思路
本申请所要解决的技术问题是,提供一种生成视频元信息的方法和装置,代替人工补充视频元信息的方式,简单、便捷、快速补充完善目标视频元信息,使得目标视频元信息较为完整、准确,从而优化后续视频搜索的召回效果,提升用户视频搜索的体验感受。第一方面,本申请实施例提供了一种生成视频元信息的方法,该方法包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。可选的,所述基于搜索 ...
【技术保护点】
1.一种生成视频元信息的方法,其特征在于,包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。
【技术特征摘要】
1.一种生成视频元信息的方法,其特征在于,包括:基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合;根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合;基于所述目标搜索词集合中各个目标搜索词,生成所述目标视频的元信息。2.根据权利要求1所述的方法,其特征在于,所述基于搜索日志中目标视频与各个搜索词的点击关系,确定所述目标视频对应的搜索词集合,包括:基于所述搜索日志中目标视频与各个搜索词的点击关系,获得所述各个搜索词对应所述目标视频的点击次数;选取所述各个搜索词中对应所述目标视频的点击次数大于第一点击次数阈值的搜索词,确定所述目标视频对应的搜索词集合。3.根据权利要求1所述的方法,其特征在于,所述预设过滤策略包括点击率阈值过滤策略和/或屏蔽词过滤策略和/或专名实体命中过滤策略。4.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括点击率阈值过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:基于所述目标视频与所述搜索词集合中各个搜索词的点击关系和展示关系,获得所述搜索词集合中各个搜索词对应所述目标视频的点击率;过滤所述搜索词集合中对应所述目标视频的点击率小于点击率阈值的搜索词,获得目标搜索词集合。5.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括屏蔽词过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:过滤所述搜索词集合中包括所述预设屏蔽词的搜索词,获得目标搜索词集合。6.根据权利要求3所述的方法,其特征在于,若所述预设过滤策略包括专名实体命中过滤策略,所述根据预设过滤策略过滤所述搜索词集合中各个搜索词,获得目标搜索词集合,包括:确定所述目标视频的视频标题包括的第一专名实体、所述第一专名实体对应白名单实体以及所述搜索词集合中各个搜索词包括的第二专名实体;基于所述第二专名实体与所述第一专名实体和所述第一专名实体对应白名单实体的重合数量,过滤所述搜索词集合中各个搜索词获得目标搜索词集合。7.根据权利要求6所述的方法,其特征在于,所述第一专名实体对应白名单实体的生成步骤包括:基于所述搜索日志中用户与各个专名实体的搜索关系,获...
【专利技术属性】
技术研发人员:叶澄灿,陈英傑,王天畅,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。