一种视频搜索方法及装置制造方法及图纸

技术编号:14978150 阅读:70 留言:0更新日期:2017-04-03 10:51
本发明专利技术公开了一种视频搜索方法及装置,其中该方法包括:利用预设的分类模型,预测待标注视频中视频帧的视频帧标签;将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对待标注视频标注相应的视频帧标签;在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定搜索请求相应的视频帧标签;在候选视频中查找标注有视频帧标签的目标视频;对目标视频进行展示。本发明专利技术实施例通过对视频帧标签进行预测、合并以及标注,从而基于视频帧标签的标注结果确定搜索请求相应的视频帧标签,即利用预先标注的视频帧标签对视频的内容进行搜索,相对于基于人工添加标题的方式,大大的提高了视频搜索的效率以及搜索结果的准确率。

【技术实现步骤摘要】

本专利技术属于通信
,尤其涉及一种视频搜索方法及装置
技术介绍
随着互联网技术的迅速发展,互联网上可供用户搜索查询的网络资源也越来越多,在这众多的资源中,准确搜索出用户需要的资源也显得尤为重要。以视频资源为例,通常情况下采用人工运营的方式,将视频进行拆分和剪辑,编辑出多个片段视频,并添加相关标题。用户通过统一的综合搜索框,输入搜索词进行全网搜索,若搜索词跟添加的标题完全匹配时,展示搜索结果。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,由于现有技术中从视频的拆分、剪辑到标题的添加,都需要人工进行,人工运营成分较多,容易出现标题不全面或不准确的现象,因此会直接导致视频搜索效率低以及搜索结果准确率不高的问题。
技术实现思路
本专利技术的目的在于提供一种视频搜索方法及装置,旨在提高搜索效率以及搜索结果的准确率。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种视频搜索方法,其中包括:获取待标注视频,并利用预设的分类模型,预测所述待标注视频中视频帧的视频帧标签;将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对所述待标注视频标注相应的视频帧标签;在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定所述搜索请求相应的视频帧标签;在候选视频中,查找标注有所述视频帧标签的目标视频,并对所述目标视频进行展示。为解决上述技术问题,本专利技术实施例还提供以下技术方案:一种视频搜索装置,其中包括:标签预测单元,用于获取待标注视频,并利用预设的分类模型,预测所述待标注视频中视频帧的视频帧标签;第一标注单元,用于将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对所述待标注视频标注相应的视频帧标签;标签确定单元,用于在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定所述搜索请求相应的视频帧标签;查找单元,用于在候选视频中,查找标注有所述视频帧标签的目标视频;展示单元,用于对所述目标视频进行展示。相对于现有技术,本专利技术实施例,首先利用预设的分类模型,对待标注视频中视频帧的视频帧标签进行预测,并将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对待标注视频标注相应的视频帧标签;其后,在接收到用户指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定搜索请求相应的视频帧标签,从而在候选视频中查找出标注有该视频帧标签的目标视频并进行展示;本实施例中,通过对视频帧标签进行预测、合并以及标注,从而基于视频帧标签的标注结果确定搜索请求相应的视频帧标签,即利用预先标注的视频帧标签对视频的内容进行搜索,相对于基于人工添加标题的方式,大大的提高了视频搜索的效率以及搜索结果的准确率。附图说明下面结合附图,通过对本专利技术的具体实施方式详细描述,将使本专利技术的技术方案及其它有益效果显而易见。图1a是本专利技术实施例提供的视频搜索装置的场景示意图;图1b是本专利技术第一实施例提供的视频搜索方法的流程示意图;图2a至图2h为本专利技术第二实施例提供的视频搜索方法的场景示意图;图3a为本专利技术第三实施例提供的视频搜索装置的结构示意图;图3b为本专利技术第三实施例提供的视频搜索装置的另一结构示意图。具体实施方式请参照图式,其中相同的组件符号代表相同的组件,本专利技术的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本专利技术具体实施例,其不应被视为限制本专利技术未在此详述的其它具体实施例。在以下的说明中,本专利技术的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本专利技术原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。本专利技术的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本专利技术的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。本专利技术实施例提供一种视频搜索方法及装置。参见图1a,该图为本专利技术实施例提供的视频搜索装置所处系统的场景示意图,该视频搜索系统可以包括视频搜索装置,主要用于利用预设的分类模型,预测待标注视频中视频帧的视频帧标签,并将时间相邻的且具有相同的视频帧标签的视频帧进行合并,从而实现对待标注视频标注相应的视频帧标签;其后,接收用户输入的指示搜索视频的搜索请求,如指示搜索“A剧集吻戏”、“B剧集搞笑戏”等等,基于视频帧标签的标注结果,确定与搜索请求相应的视频帧标签,接着,在候选视频中,如某一指定视频、或者全网视频等,查找出标注有该视频帧标签的目标视频,最后对目标视频进行展示。此外,该视频搜索系统还可以包括视频库,主要用于存储待标注视频,以使视频搜索装置可以对待标注视频标注相应的视频帧标签;该视频库中还存储有实际场景中涉及到的搜索内容以及与所述搜索内容对应的意图标签,以使得视频搜索装置基于此进行训练,生成神经网络模型;另外,该视频库还存储有大量候选视频,以供视频搜索装置从中查找出目标视频,等等。当然,该视频搜索系统还可以包括用户终端,用于通过输入装置,如键盘、鼠标等,接收用户直接输入搜索请求,并在确定出目标视频后,通过输出装置,如终端屏幕等,对目标视频进行播放。以下将分别进行详细说明。第一实施例在本实施例中,将从视频搜索装置的角度进行描述,该视频搜索装置具体可以集成在服务器或网关等网络设备中。一种视频搜索方法,包括:获取待标注视频,并利用预设的分类模型,预测待标注视频中视频帧的视频帧标签;将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对待标注视频标注相应的视频帧标签;在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定搜索请求相应的视频帧标签;在候选视频中,查找标注有该视频帧标签的目标视频,并对该目标视频进行展示。请参阅图1b,图1b是本专利技术第一实施例提供的视本文档来自技高网...

【技术保护点】
一种视频搜索方法,其特征在于,包括:获取待标注视频,并利用预设的分类模型,预测所述待标注视频中视频帧的视频帧标签;将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对所述待标注视频标注相应的视频帧标签;在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定所述搜索请求相应的视频帧标签;在候选视频中,查找标注有所述视频帧标签的目标视频,并对所述目标视频进行展示。

【技术特征摘要】
1.一种视频搜索方法,其特征在于,包括:
获取待标注视频,并利用预设的分类模型,预测所述待标注视频中视频帧
的视频帧标签;
将时间相邻的且具有相同的视频帧标签的视频帧进行合并,对所述待标注
视频标注相应的视频帧标签;
在接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定所
述搜索请求相应的视频帧标签;
在候选视频中,查找标注有所述视频帧标签的目标视频,并对所述目标视
频进行展示。
2.根据权利要求1所述的视频搜索方法,其特征在于,所述利用预设的分
类模型,预测所述待标注视频中视频帧的视频帧标签,包括:
利用关键帧提取算法提取所述待标注视频的视频帧,并确定为第一视频帧;
获取每个所述第一视频帧的图像特征,并确定为第一图像特征;
根据所述第一图像特征,利用预设的分类模型预测第一视频帧的视频帧标
签;
所述将时间相邻的且具有相同的视频帧标签的视频帧进行合并具体为:将
时间相邻的且具有相同的视频帧标签的第一视频帧进行合并。
3.根据权利要求2所述的视频搜索方法,其特征在于,所述获取待标注视
频之前,还包括:
收集预先已进行场景标签标注的原有视频;
利用关键帧提取算法提取所述原有视频的视频帧,并确定为第二视频帧;
根据所述场景标签,对所述第二视频帧标注视频帧标签;
获取每个所述第二视频帧的图像特征,并确定为第二图像特征;
基于对所述第二视频帧标注的视频帧标签以及所述第二图像特征进行训

\t练,生成分类模型;
所述根据所述第一图像特征,利用预设的分类模型预测第一视频帧的视频
帧标签具体为:根据所述第一图像特征,利用所述分类模型预测第一视频帧的
视频帧标签。
4.根据权利要求1至3任一项所述的视频搜索方法,其特征在于,所述在
接收到指示搜索视频的搜索请求时,基于视频帧标签的标注结果确定所述搜索
请求相应的视频帧标签,包括:
在接收到指示搜索视频的搜索请求时,基于预设的神经网络模型,对所述
搜索请求进行语义识别;
结合语义识别的结果以及视频帧标签的标注结果,确定所述搜索请求相应
的视频帧标签。
5.根据权利要求4所述的视频搜索方法,其特征在于,所述接收指示搜索
视频的搜索请求之前,还包括:
收集搜索内容以及与所述搜索内容对应的意图标签;
基于所述搜索内容以及所述意图标签进行训练,生成神经网络模型;
所述基于预设的神经网络模型,对所述搜索请求进行语义识别具体为:基
于所述神经网络模型,对所述搜索请求进行语义识别。
6.根据权利要求1所述的视频搜索方法,其特征在于,
当所述候选视频为一个当前播放的视频时,所述接收到指示搜索视频的搜
索请求具体为:在所述当前播放的视频对应的搜索框中,接收到指示搜索视频
的搜索请求;
所述对所述目标视频进行展示具体为:在所述当前播放的视频的播放进度
条中,确定出所述目标视频的播放位置,并基于所述播放位置进行标注提示,
以供用户选择进行段落播放。
7.根据权利要求1所述的视频搜索方法,其特征在于,
当所述候选视频为全网视频集合时,所述接收到指示搜索视频的搜索请求

\t具体为:在全网搜索框中,接收到指示搜索视频的搜索请求;
所述对所述目标视频进行展示具体为:将所述目标视频以及目标视频的属
性信息以列表形式进行展示。

【专利技术属性】
技术研发人员:肖瑛杨振宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1