多媒体文件搜索方法及装置制造方法及图纸

技术编号:8191004 阅读:128 留言:0更新日期:2013-01-10 01:54
本发明专利技术公开了多媒体文件搜索方法及装置,其中,所述方法包括:获取多媒体文件的文本辅助信息文件,所述文本辅助信息文件中保存有多媒体文件的文本内容以及对应的时间点信息;基于所述文本辅助信息文件中的文本内容为所述多媒体文件建立索引;当接收到搜索关键词时,获取包含有所述搜索关键词的第一目标文本辅助信息文件,并确定出所述搜索关键词在所述第一目标文本辅助信息文件中所在位置处的时间值;根据所述第一目标文本辅助信息文件确定对应的第一目标多媒体文件,并返回所述第一目标多媒体文件中对应时间值处的相关信息。通过本发明专利技术,能够实现对多媒体文件的全文搜索。

【技术实现步骤摘要】

本专利技术涉及搜索
,特别是涉及多媒体文件搜索方法及装置
技术介绍
随着因特网的普及,大量的信息迅速累积并被广泛使用。因此,时空距离不再是人们存取与使用信息的最大障碍,取而代之的问题是缺乏有效率的方式在浩瀚的因特网中寻找想要的信息。信息检索技术因为能够提供使用者便捷的方式存取和使用想要的信息,因此近些年来格外受到重视。直到现在为止,大部分信息检索的研究都是以文字性的查询指令去检索文字形式的信息为主,也就是做文字与文件间的比对。但是,目前,传统文字形式之外的影音多媒体信息如广播、电视节目、视频等,大量地出现在因特网上,显然已成为文字信息 之外非常重要的信息来源。但是,在绝大部分情况下,语音是这些多媒体信息最主要的组成部分,因此,起初对于多媒体文件的检索一般仅限于文件名的检索。例如,以某多媒体文件的文件名作为查询词进行搜索时,一般可以返回完整的多媒体文件,或者相关的评论信息坐坐寸寸ο然而在实际应用中,人们有时候仅需要查看某多媒体文件中的某个片段,此时,在现有技术下,一般只能先找到该多媒体文件,然后凭记忆确定出想要看的片段的大概位置,再在视频中一段一段的查找,直到听到对应的对白或者看到对应的字幕,才能确定找到了目标片段。整个查找过程非常繁琐,并且用户经过一段时间的查找之后也不一定能找到想要的片段,浪费了时间。
技术实现思路
本专利技术提供了多媒体文件搜索方法及装置,能够实现对多媒体文件的全文搜索。本专利技术提供了如下方案一种多媒体文件搜索方法,包括获取多媒体文件的文本辅助信息文件,所述文本辅助信息文件中保存有多媒体文件的文本内容以及对应的时间点信息;基于所述文本辅助信息文件中的文本内容为所述多媒体文件建立索引;当接收到搜索关键词时,获取包含有所述搜索关键词的第一目标文本辅助信息文件,并确定出所述搜索关键词在所述第一目标文本辅助信息文件中所在位置处的时间值;根据所述第一目标文本辅助信息文件确定对应的第一目标多媒体文件,并返回所述第一目标多媒体文件中对应时间值处的相关信息。可选地,所述返回所述第一目标多媒体文件中对应时间值处的相关信息包括返回所述第一目标多媒体文件及其属性值、目标文本辅助信息文件中包含所述搜索关键词的文本内容及其对应的时间值。可选地,所述返回所述第一目标多媒体文件中对应时间值处的相关信息包括返回所述第一目标多媒体文件中对应时间值处预置时间段内的文件片段。可选地,所述多媒体文件包括视频文件,所述返回所述第一目标多媒体文件中对应时间值处的相关信息包括返回所述第一目标多媒体文件中对应时间值处的视频截图。可选地,还包括当接收到搜索关键词时,通过查询预置的语义相关词语数据库,获取与所述搜索关键词语义相关的相关关键词;获取包含有所述相关关键词的第二目标文本辅助信息文件,并确定出所述相关关键词在所述第二目标文本辅助信息文件中所在位置处的时间值;根据所述第二目标文本辅助信息文件确定对应的第二目标多媒体文件,并返回所述第二目标多媒体文件中对应时间值处的相关信息。可选地,所述获取多媒体文件的文本辅助信息文件包括从预置的文本辅助信息文件资源库中,为各个多媒体文件选择匹配的文本辅助信息文件。一种多媒体文件搜索装置,包括文本辅助信息文件获取单元,用于获取多媒体文件的文本辅助信息文件,所述文本辅助信息文件中保存有多媒体文件的文本内容以及对应的时间点信息;索引建立单元,用于基于所述文本辅助信息文件中的文本内容为所述多媒体文件建立索引;第一搜索单元,用于当接收到搜索关键词时,获取包含有所述搜索关键词的第一目标文本辅助信息文件,并确定出所述搜索关键词在所述第一目标文本辅助信息文件中所在位置处的时间值;第一信息返回单元,用于根据所述第一目标文本辅助信息文件确定对应的第一目标多媒体文件,并返回所述第一目标多媒体文件中对应时间值处的相关信息。可选地,所述第一信息返回单元包括文本信息返回子单元,用于返回所述第一目标多媒体文件及其属性值、目标文本辅助信息文件中包含所述关键词的文本内容及其对应的时间值。可选地,所述第一信息返回单元包括文件片段返回子单元,用于返回所述第一目标多媒体文件中对应时间值处预置时间段内的文件片段。可选地,所述多媒体文件包括视频文件,所述第一信息返回单元包括视频截图返回子单元,用于返回所述第一目标多媒体文件中对应时间值处的视频截图。可选地,还包括关键词扩展单元,用于当接收查询关键词时,通过查询预置的语义相关词语数据库,获取与所述关键词语义相关的相关关键词;第二搜索单元,用于获取包含有所述相关关键词的第二目标文本辅助信息文件,并确定出所述相关关键词在所述第二目标文本辅助信息文件中所在位置处的时间值;第二信息返回单元,用于根据所述第二目标文本辅助信息文件确定对应的第二目标多媒体文件,并返回所述第二目标多媒体文件中对应时间值处的相关信息。可选地,所述文本辅助信息文件获取单元具体用于从预置的文本辅助信息文件资源库中,为各个多媒体文件选择匹配的文本辅助信息文件。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果通过本专利技术,可以通过将多媒体文件与其文本辅助信息文件进行绑定,从而可以通过搜索关键词在文本辅助信息文件中的时间点,准确找到其在多媒体文件中的时间点,进而就可以将多媒体文件中对应时间点上的相关信息返回给用户,从而可以实现对多媒体文件的全文搜索,使得用户可以准确地找到某片段,或者某个画面、某句台词等等,极大地 方便了用户的应用。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I是本专利技术实施例提供的方法的流程图;图2是本专利技术实施例提供的方法中一界面示意图;图3是本专利技术实施例提供的方法中另一界面示意图;图4是本专利技术实施例提供的装置的示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,本专利技术实施例提供的多媒体文件搜索方法可以包括以下步骤SlOl :获取多媒体文件的文本辅助信息文件,所述文本辅助信息文件中保存有多媒体文件的文本内容以及对应的时间点信息;在本专利技术实施例中,多媒体文件可以包括视频文件(即既有声音又有图像的文件,例如RMVB等格式的电影、电视剧文件等)、音频文件(即只有声音没有图像的文件,例如MP3等格式的歌曲文件等),其中,关于视频文件,文本辅助信息文件可以是指SRT等格式的字幕文件,这些字幕文件作为视频资源的精确补充,通常包含了台词出现的特定时间和台词的中英文文本信息,还可能包括场景解释、人物解释等;关于音频文件,文本辅助信息文件可以是指LRC等格式的歌词文件等等。这些文件一般都是由专业人员制作的,具有较高的准确性,因此,在本专利技术实施例中,可以以这些文本辅助信息文件为基础对多媒体文件进行搜索。具体实现时,一般会存在一些专门提供文本辅助信息文件的数据库、网站等,因此,为了给多媒体文件匹配文本辅助信息文件本文档来自技高网...

【技术保护点】
一种多媒体文件搜索方法,包括:获取多媒体文件的文本辅助信息文件,所述文本辅助信息文件中保存有多媒体文件的文本内容以及对应的时间点信息;基于所述文本辅助信息文件中的文本内容为所述多媒体文件建立索引;当接收到搜索关键词时,获取包含有所述搜索关键词的第一目标文本辅助信息文件,并确定出所述搜索关键词在所述第一目标文本辅助信息文件中所在位置处的时间值;根据所述第一目标文本辅助信息文件确定对应的第一目标多媒体文件,并返回所述第一目标多媒体文件中对应时间值处的相关信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭帅吴海生
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1