当前位置: 首页 > 专利查询>惠州学院专利>正文

视频影像重点画面抓取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:19342170 阅读:20 留言:0更新日期:2018-11-07 13:54
本发明专利技术提供一种视频影像重点画面抓取方法、装置、存储介质及电子设备,视频影像具有与之同步播放的音频信息,该方法包括以下步骤:获取所述视频影像的种类信息;根据所述种类信息设置关键字或者关键词;对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。本发明专利技术具有提高抓取速度的有益效果。

Video image key picture grasping method, device, storage medium and electronic equipment

The present invention provides a method, device, storage medium and electronic equipment for capturing key picture of video image. The video image has audio information synchronously played with it. The method includes the following steps: acquiring the type information of the video image; setting keywords or keywords according to the type information; and performing the video synchronously. The audio information corresponding to the image is recognized by speech recognition to find out the time information with the keywords or keywords in the audio information, and the key pictures are selected from the multi-frame pictures of the video image according to the time information. The invention has the beneficial effect of improving the grasping speed.

【技术实现步骤摘要】
视频影像重点画面抓取方法、装置、存储介质及电子设备
本申请涉及视频处理领域,具体涉及一种视频影像重点画面抓取方法、装置、存储介质及电子设备。
技术介绍
现有技术中的重点画面抓取都是通过对视频的画面进行一帧一帧进行识别,然后才能抓取出其中的重点画面,但是采用这种方法的效率十分低下。因此,现有技术存在缺陷,急需改进。
技术实现思路
本申请实施例提供一种视频影像重点画面抓取方法、装置、存储介质及电子设备,可以抓取的效率。本申请实施例提供一种视频影像重点画面抓取方法,视频影像具有与之同步播放的音频信息,包括以下步骤:获取所述视频影像的种类信息;根据所述种类信息设置关键字或者关键词;对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。在本申请实施例所述的视频影像重点画面抓取方法中,所述种类信息包括犯罪类、爱情类、科幻类、动作类、现实录像类。在本申请实施例所述的视频影像重点画面抓取方法中,所述对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息的步骤包括:对所述视频影像对应的音频信息的音频信息进行语音识别,得到与所述音频数据对应的文字串信息,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;对所述文字串中的各个文字进行逐一筛选,以获取关键字或者关键词的时间信息。在本申请实施例所述的视频影像重点画面抓取方法中,所述对所述视频影像对应的音频信息的音频信息进行语音识别,得到与所述音频数据对应的文字串信息的步骤包括:对所述视频影像对应的音频信息的音频信息进行语音识别,得到所述音频数据对应的文字串信息,其中,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;所述文字串包括人物对话文字以及器物声音对应的拟声词信息,该拟声词信息具有拟声词以及对应的器物种类。在本申请实施例所述的视频影像重点画面抓取方法中,所述根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面的步骤包括:根据时间信息将关键字或者关键词出现的时间点前后预设时间段内的时间设置为重点时间;获取所述视频影像在所述重点时间内的各帧画面,并将该各帧画面设定为重点画面。一种视频影像重点画面抓取装置,视频影像具有与之同步播放的音频信息,该装置包括:获取模块,用于获取所述视频影像的种类信息;设置模块,用于根据所述种类信息设置关键字或者关键词;识别模块,用于对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;筛选模块,用于根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。在本申请实施例所述的视频影像重点画面抓取装置中,所述识别模块包括:识别单元,用于对所述视频影像对应的音频信息的音频信息进行语音识别,得到与所述音频数据对应的文字串信息,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;第一筛选单元,用于对所述文字串中的各个文字进行逐一筛选,以获取关键字或者关键词的时间信息。在本申请实施例所述的视频影像重点画面抓取装置中,所述识别单元用于:对所述视频影像对应的音频信息的音频信息进行语音识别,得到所述音频数据对应的文字串信息,其中,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;所述文字串包括人物对话文字以及器物声音对应的拟声词信息,该拟声词信息具有拟声词以及对应的器物种类。一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述任一项所述的方法。一种电子设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行上述任一项方法。由上可知,本专利技术通过获取所述视频影像的种类信息;根据所述种类信息设置关键字或者关键词;对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面;从而实现对重点画面的抓取,具有提高抓取速度,提高效率的有益效果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的视频影像重点画面抓取方法的流程示意图。图2是本申请实施例提供的视频影像重点画面抓取装置的结构示意图。图3是本申请实施例提供的电子设备的结构示意图。具体实施方式下面详细描述本申请的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接或可以相互通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。在本申请中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。下文的公开提供了许多不同的实施方式或例子用来实现本申请的不同结构。为了简化本申请的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本申请。此外,本申请可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本申请提供了的各种特定的工艺和材料的例子,但是本领域本文档来自技高网...

【技术保护点】
1.一种视频影像重点画面抓取方法,视频影像具有与之同步播放的音频信息,其特征在于,包括以下步骤:获取所述视频影像的种类信息;根据所述种类信息设置关键字或者关键词;对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。

【技术特征摘要】
1.一种视频影像重点画面抓取方法,视频影像具有与之同步播放的音频信息,其特征在于,包括以下步骤:获取所述视频影像的种类信息;根据所述种类信息设置关键字或者关键词;对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息;根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面。2.根据权利要求1所述的视频影像重点画面抓取方法,其特征在于,所述种类信息包括犯罪类、爱情类、科幻类、动作类、现实录像类。3.根据权利要求1所述的视频影像重点画面抓取方法,其特征在于,所述对所述视频影像对应的音频信息进行语音识别,以找出所述音频信息中具有所述关键字或者关键词的时间信息的步骤包括:对所述视频影像对应的音频信息的音频信息进行语音识别,得到与所述音频数据对应的文字串信息,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;对所述文字串中的各个文字进行逐一筛选,以获取关键字或者关键词的时间信息。4.根据权利要求3所述的视频影像重点画面抓取方法,其特征在于,所述对所述视频影像对应的音频信息的音频信息进行语音识别,得到与所述音频数据对应的文字串信息的步骤包括:对所述视频影像对应的音频信息的音频信息进行语音识别,得到所述音频数据对应的文字串信息,其中,所述文字串信息包括文字串以及其中每一文字在所述视频影像时间轴上的位置;所述文字串包括人物对话文字以及器物声音对应的拟声词信息,该拟声词信息具有拟声词以及对应的器物种类。5.根据权利要求3所述的视频影像重点画面抓取方法,其特征在于,所述根据所述时间信息从所述视频影像的多帧画面中筛选出重点画面的步骤包括:根据时间信息将关键字或者关键词出现的时间点前后预设...

【专利技术属性】
技术研发人员:蔡昭权蔡映雪胡辉胡松陈伽黄思博黄翰梁椅辉罗伟
申请(专利权)人:惠州学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1