音视频的检索方法及装置制造方法及图纸

技术编号:19543870 阅读:21 留言:0更新日期:2018-11-24 20:37
本申请公开了一种音视频的检索方法及装置。该方法包括:获取检索语句,其中,检索语句用于对目标音视频进行检索;将检索语句与索引指向的多个语句进行匹配,得到与检索语句匹配成功的语句,其中,多个语句为音视频集合中的各个音视频对应的多个语句;返回与检索语句匹配成功的语句对应的音视频;以及在对应的音视频中确定目标音视频。通过本申请,解决了相关技术中对音视频检索的准确性较低的问题。

Audio and Video Retrieval Method and Device

This application discloses an audio and video retrieval method and device. The method includes: acquiring retrieval statements, in which the retrieval statements are used to retrieve the target audio and video; matching the retrieval statements with the multiple statements pointed to by the index to obtain the successful matching statements with the retrieval statements, in which the multiple statements are the multiple statements corresponding to each audio and video in the audio and video set; returning with the The retrieval statement matches the audio and video corresponding to the successful statement, and determines the target audio and video in the corresponding audio and video. Through this application, the problem of low accuracy of audio and video retrieval in related technologies is solved.

【技术实现步骤摘要】
音视频的检索方法及装置
本申请涉及音视频技术处理领域,具体而言,涉及一种音视频的检索方法及装置。
技术介绍
为了对音频、视频文件进行检索,特别是针对电话录音、采访录音、采访视频这样的音频、视频文件。通常,通过对音频、视频文件名称进行全文索引,然后对名称进行检索。然而该方案只能对音频名称、视频名称进行检索,无法知道音频、视频的内容,这样查找出的文件可能并不是想要的。相关技术中对音频、视频文件增加简介,然后对名称和简介进行全文检索。虽然可以根据简介找到对应的音频、视频文件,但是整理音频、视频文件的简介也需要大量的人工成本,如果音视频简介和音视频的内容不对应,检索准确度将大大降低。针对相关技术中对音视频检索的准确性较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种音视频的检索方法及装置,以解决相关技术中对音视频检索的准确性较低的问题。为了实现上述目的,根据本申请的一个方面,提供了一种音视频的检索方法。该方法包括:获取检索语句,其中,所述检索语句用于对目标音视频进行检索;将所述检索语句与索引指向的多个语句进行匹配,得到与所述检索语句匹配成功的语句,其中,所述多个语句为音视频集合中的各个音视频对应的多个语句;返回与所述检索语句匹配成功的语句对应的音视频;以及在所述对应的音视频中确定所述目标音视频。进一步地,在将所述检索语句与索引指向的多个语句进行匹配之前,所述方法还包括:分别将所述音视频集合中的每个音视频转换为对应的文本;按照第一预设条件对每个音视频对应的文本进行拆分,得到每个音视频对应的多个语句;确定每个语句在所对应的音视频中的起始位置和结束位置。进一步地,在所述对应的音视频中确定所述目标音视频之后,所述方法还包括:根据所述目标音视频中每个语句的起始位置和结束位置,确定目标语句在所述目标音视频中对应的起始位置和结束位置,其中,目标语句为所述目标音视频中与所述检索语句匹配成功的语句;将所述目标语句在所述目标音视频中对应的起始位置和结束位置发送至音视频播放器,其中,在所述音视频播放器接收到所述目标音视频中对应的起始位置和结束位置之后,所述音视频播放器跳转至所述目标音视频中的起始位置开始播放。进一步地,确定每个语句在所对应的音视频中的起始位置和结束位置包括:按照第二预设条件将每个音视频划分为预设长度的音视频片段;将每个音视频片段转换为对应的文字信息;将每个音视频对应的多个语句按照顺序关系逐一与当前音视频中音视频片段对应的文字信息进行匹配,确定每个语句在当前音视频中的起始位置和结束位置。进一步地,在根据所述检索语句与索引指向的多个语句进行匹配之前,所述方法还包括:对每个音视频对应的多个语句基于目标信息进行创建索引,其中,所述目标信息包括:语句内容、所述语句在所对应的音视频中的起始位置和结束位置、所对应的音视频的名称。为了实现上述目的,根据本申请的另一方面,提供了一种音视频的检索装置。该装置包括:第一获取单元,用于获取检索语句,其中,所述检索语句用于对目标音视频进行检索;匹配单元,用于将所述检索语句与索引指向的多个语句进行匹配,得到与所述检索语句匹配成功的语句,其中,所述多个语句为音视频集合中的各个音视频对应的多个语句;第二获取单元,用于返回与所述检索语句匹配成功的语句对应的音视频;以及第一确定单元,用于在所述对应的音视频中确定所述目标音视频。进一步地,该装置包括:转换单元,用于在将所述检索语句与索引指向的多个语句进行匹配之前,分别将所述音视频集合中的每个音视频转换为对应的文本;拆分单元,用于按照第一预设条件对每个音视频对应的文本进行拆分,得到每个音视频对应的多个语句;第二确定单元,用于确定每个语句在所对应的音视频中的起始位置和结束位置。进一步地,所述装置还包括:第三确定单元,用于在所述对应的音视频中确定所述目标音视频之后,根据所述目标音视频中每个语句的起始位置和结束位置,确定目标语句在所述目标音视频中对应的起始位置和结束位置,其中,目标语句为所述目标音视频中与所述检索语句匹配成功的语句;发送单元,用于将所述目标语句在所述目标音视频中对应的起始位置和结束位置发送至音视频播放器,其中,在所述音视频播放器接收到所述目标音视频中对应的起始位置和结束位置之后,所述音视频播放器跳转至所述目标音视频中的起始位置开始播放。为了实现上述目的,根据本申请的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述任意一项所述的音视频的检索方法。为了实现上述目的,根据本申请的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的音视频的检索方法。通过本申请,采用以下步骤:获取检索语句,其中,检索语句用于对目标音视频进行检索;将检索语句与索引指向的多个语句进行匹配,得到与检索语句匹配成功的语句,其中,多个语句为音视频集合中的各个音视频对应的多个语句;返回与检索语句匹配成功的语句对应的音视频;以及在对应的音视频中确定目标音视频。解决了相关技术中对音视频检索的准确性较低的问题。通过将检索语句与索引指向的多个语句进行匹配,然后在与检索语句匹配成功的语句对应的音视频中确定目标音视频,进而达到了提升对音视频检索的准确性的效果。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例提供的音视频的检索方法的流程图;以及图2是根据本申请实施例提供的音视频的检索装置的示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本申请的实施例,提供了一种音视频的检索方法。图1是根据本申请实施例的音视频的检索方法的流程图。如图1所示,该方法包括以下步骤:步骤S101,获取检索语句,其中,检索语句用于对目标音视频进行检索。为了在电话录音、采访录音、采访视频等多个音频、视频文件中查找用户需要查找的目标音视频,接收用户输入的检索语句,基于检索语句对目标音视频进行检索。或者,接收用户输入的语音,通过语音识别技术,将该语音转换为文字,作为检索语句。步骤S102,将检索语句与索引指向的多个语句进行匹配,得到与检索语句匹配成本文档来自技高网
...

【技术保护点】
1.一种音视频的检索方法,其特征在于,包括:获取检索语句,其中,所述检索语句用于对目标音视频进行检索;将所述检索语句与索引指向的多个语句进行匹配,得到与所述检索语句匹配成功的语句,其中,所述多个语句为音视频集合中的各个音视频对应的多个语句;返回与所述检索语句匹配成功的语句对应的音视频;以及在所述对应的音视频中确定所述目标音视频。

【技术特征摘要】
1.一种音视频的检索方法,其特征在于,包括:获取检索语句,其中,所述检索语句用于对目标音视频进行检索;将所述检索语句与索引指向的多个语句进行匹配,得到与所述检索语句匹配成功的语句,其中,所述多个语句为音视频集合中的各个音视频对应的多个语句;返回与所述检索语句匹配成功的语句对应的音视频;以及在所述对应的音视频中确定所述目标音视频。2.根据权利要求1所述的方法,其特征在于,在将所述检索语句与索引指向的多个语句进行匹配之前,所述方法还包括:分别将所述音视频集合中的每个音视频转换为对应的文本;按照第一预设条件对每个音视频对应的文本进行拆分,得到每个音视频对应的多个语句;确定每个语句在所对应的音视频中的起始位置和结束位置。3.根据权利要求2所述的方法,其特征在于,在所述对应的音视频中确定所述目标音视频之后,所述方法还包括:根据所述目标音视频中每个语句的起始位置和结束位置,确定目标语句在所述目标音视频中对应的起始位置和结束位置,其中,目标语句为所述目标音视频中与所述检索语句匹配成功的语句;将所述目标语句在所述目标音视频中对应的起始位置和结束位置发送至音视频播放器,其中,在所述音视频播放器接收到所述目标音视频中对应的起始位置和结束位置之后,所述音视频播放器跳转至所述目标音视频中的起始位置开始播放。4.根据权利要求2所述的方法,其特征在于,确定每个语句在所对应的音视频中的起始位置和结束位置包括:按照第二预设条件将每个音视频划分为预设长度的音视频片段;将每个音视频片段转换为对应的文字信息;将每个音视频对应的多个语句按照顺序关系逐一与当前音视频中音视频片段对应的文字信息进行匹配,确定每个语句在当前音视频中的起始位置和结束位置。5.根据权利要求2所述的方法,其特征在于,在根据所述检索语句与索引指向的多个语句进行匹配之前,所述方法还包括:对每个音视频对应的多个语句基于目标信息进行创建索引,其中...

【专利技术属性】
技术研发人员:王晓涛
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1