视频信息处理方法及装置制造方法及图纸

技术编号:15880385 阅读:24 留言:0更新日期:2017-07-25 18:29
本申请提供一种视频信息处理方法及装置。方法包括:对会议介绍过程进行录制,以获得会议介绍片段;对所述会议介绍片段进行语音识别,以获得所述会议的主题内容;根据所述会议的主题内容,生成所述会议的摘要信息。本申请可以更加简便的生成会议的摘要信息,提高生成效率。

Video information processing method and apparatus

The present invention provides a video information processing method and apparatus. The method comprises: a meeting to introduce the process of recording, in order to get the meeting introduced segments; speech recognition on the meeting to introduce fragments, with the theme of the conference content; according to the theme of the content of the meeting, the meeting summary information generation. The application can simplify the summary information of the meeting and improve the generation efficiency.

【技术实现步骤摘要】
视频信息处理方法及装置
本申请涉及通信
,尤其涉及一种视频信息处理方法及装置。
技术介绍
在视频会议场景中,会录制大量的视频文件。在后续过程中,如果想要从视频文件中快速查找自己需要的视频文件,往往需要粗略浏览整个视频文件,从而花费比较长的时间,影响工作的效率。为便于后续检索,可以为视频文件生成摘要。后续可以基于摘要进行视频文件的检索,有利于提高检索效率。其中,一种为视频文件生成摘要的方法是:在会议时间线上的多个时间点中的每个时间点上,基于配置文件提取各个会场的关键信息,将各个会场的关键信息组合成关键索引点,基于多个时间点的多个关键索引点结合为会议摘要,这种方式比较复杂,效率较低。
技术实现思路
本申请的多个方面提供一种视频信息处理方法及装置,用以更加简便的生成会议的摘要信息,提高生成效率。本申请的一方面,提供一种视频信息处理方法,包括:对会议介绍过程进行录制,以获得会议介绍片段;对所述会议介绍片段进行语音识别,以获得所述会议的主题内容;根据所述会议的主题内容,生成所述会议的摘要信息。本申请的另一方面,提供一种视频信息处理装置,包括:录制模块,用于对会议介绍过程进行录制,以获得会议介绍片段;识别模块,用于对所述会议介绍片段进行语音识别,以获得所述会议的主题内容;生成模块,用于根据所述会议的主题内容,生成所述会议的摘要信息。在本申请中,对会议介绍过程进行录制,获得会议介绍片段,对该会议介绍片段进行语音识别,获得会议的主题内容,根据会议的主题内容生成会议的摘要信息,实现相对简单,无需对整个会议过程进行信息提取,有利于提高生成会议摘要的效率。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的视频信息处理方法的流程示意图;图2为本申请另一实施例提供的为视频文件构建索引的方法流程的示意图;图3为本申请又一实施例提供的视频信息处理装置的结构示意图;图4为本申请又一实施例提供的视频信息处理装置的结构示意图;图5为本申请又一实施例提供的构建模块的一种结构示意图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的视频信息处理方法的流程示意图。如图1所示,该方法包括:101、对会议介绍过程进行录制,以获得会议介绍片段。102、对会议介绍片段进行语音识别,以获得会议的主题内容。103、根据会议的主题内容,生成会议的摘要信息。本实施例提供一种视频信息处理方法,可由视频信息处理装置来执行,用于生成会议摘要。本实施例不对会议进行限制,也就是说,本实施例提供的方法可用于为任何会议生成摘要。所述会议可以是语音会议、视频会议、两个人参与的会议、或者多人参与的会议等。一般情况下,在会议开始阶段,都会有会议介绍者(可以是会议的主持人,或者由主持人介绍的其它人员)对会议进行介绍,介绍内容一般包括会议的主题内容、会议的主办方、参会人员、会议过程安排等等。在本实施例中,在会议开始阶段,对会议介绍过程进行录制,以获得会议介绍片段。在该会议介绍片段中包括会议的主题内容。通过对会议介绍片段进行语音识别,以获得会议的主题内容,根据会议的主题内容生成会议的摘要信息。上述语音识别也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。在本实施例中,主要是将会议介绍片段中的语音识别为文字,为生成会议的摘要信息提供条件。在本实施例中,只需对会议介绍过程进行录制,获得会议介绍片段,对该会议介绍片段进行语音识别,获得会议的主题内容,根据会议的主题内容生成会议的摘要信息,实现相对简单,无需对整个会议过程的相关信息进行提取,有利于提高生成会议摘要的效率。在一可选实施方式中,在对会议介绍过程进行录制之前,可以提示会议介绍者对会议进行介绍。例如,视频信息处理装置可以输出提示音,以提示会议介绍者对会议进行介绍,所示提示音可以是但不限于:“请进行会议介绍”、“请开始会议介绍”等形式。或者,视频信息处理装置也可以在会议屏幕上显示提示信息,以提示会议介绍者对会议进行介绍,所述提示信息可以是但不限于:“请进行会议介绍”、“请开始会议介绍”等形式。进一步,在提示会议介绍者对会议进行介绍之前,可以对会议介绍者进行检测,在检测到会议介绍者后,提示会议介绍者进行自我介绍,对会议介绍者的自我介绍过程进行录制,以获取自我介绍片段;对自我介绍片段进行内容识别,以获取会议介绍者的个人信息。例如,视频信息处理装置可以输出提示音,以提示会议介绍者进行自我介绍,所示提示音可以是但不限于:“请进行自我介绍”、“请自我介绍”等形式。或者,视频信息处理装置也可以在会议屏幕上显示提示信息,以提示会议介绍者进行自我介绍,所述提示信息可以是但不限于:“请进行自我介绍”、“请自我介绍”等形式。对自我介绍片段进行内容识别包括:对自我介绍片段进行人脸识别和语音识别,以获取自我介绍片段包含的人脸图像和语音内容,根据自我介绍片段包含的人脸图像和语音内容生成会议介绍者的个人信息。会议介绍者的个人信息可以包括会议介绍者的人脸图像以及语音介绍的姓名、职位、所在公司名称等。基于上述,一种生成会议的摘要信息的过程包括:根据会议的主题内容和会议介绍者的个人信息,生成会议的摘要信息。即,将会议的主题内容以及会议介绍者的个人信息整合起来构成会议的摘要信息。其中,在对会议介绍者进行检测的过程中,如果未能成功检测到会议介绍者,可以提示会议介绍者调整摄像头,以便成功检测会议介绍者。在对会议介绍过程进行录制的过程中,如何确定会议介绍过程结束是个关键问题。在本实施例中给出以下两种确定方法:一种确定方法是:在对会议介绍过程进行录制的过程中,检测指定用语,并在检测到指定用语时,确定会议介绍结束。一般情况下,会议介绍结束时,都会有比较明显的用语,例如“那下面正式进入会议”、“我宣布会议正式开始”、“会议介绍告于段落”等,基于此,可以预先存储这些习惯性用语,在录制过程中,若检测到这些用语,可以确定会议介绍过程结束,从而获得会议介绍片段。另一种确定方法是:在对会议介绍过程进行录制的过程中,判断已录制时间长度是否达到指定时间长度,并在判断结果为是时,确定会议介绍过程结束。一般来说,每个会议都会预先安排好会议各个阶段的时间,会议介绍过程的时间也是预先安排好的。基于此,可以预先存储会议介绍过程的时间长度,即指定时间长度,通过该指定时间长度确定会议介绍过程是否结束。值得说明的是,有时会议不一定按照预先安排的时间执行,可能会超过预先安排的时间,为此上述指定时间长度可以适当大于预先安排给会议介本文档来自技高网...
视频信息处理方法及装置

【技术保护点】
一种视频信息处理方法,其特征在于,包括:对会议介绍过程进行录制,以获得会议介绍片段;对所述会议介绍片段进行语音识别,以获得所述会议的主题内容;根据所述会议的主题内容,生成所述会议的摘要信息。

【技术特征摘要】
1.一种视频信息处理方法,其特征在于,包括:对会议介绍过程进行录制,以获得会议介绍片段;对所述会议介绍片段进行语音识别,以获得所述会议的主题内容;根据所述会议的主题内容,生成所述会议的摘要信息。2.根据权利要求1所述的方法,其特征在于,所述对会议介绍过程进行录制,以获得会议介绍片段之前,包括:提示会议介绍者对所述会议进行介绍。3.根据权利要求2所述的方法,其特征在于,所述提示会议介绍者对所述会议进行介绍之前,包括:对所述会议介绍者进行检测;在检测到所述会议介绍者后,提示所述会议介绍者进行自我介绍;对所述会议介绍者的自我介绍过程进行录制,以获取自我介绍片段;对所述自我介绍片段进行内容识别,以获取所述会议介绍者的个人信息;所述根据所述会议的主题内容,生成所述会议的摘要信息,包括:根据所述会议的主题内容和所述会议介绍者的个人信息,生成所述会议的摘要信息。4.根据权利要求2所述的方法,其特征在于,在对所述会议介绍过程进行录制的过程中包括:检测指定用语,并在检测到所述指定用语时,确定所述会议介绍过程结束;或者判断已录制时间长度是否达到指定时间长度,并在判断结果为是时,确定所述会议介绍过程结束。5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:对所述会议的整个过程进行录制,以获取所述会议的视频文件;为所述视频文件构建索引。6.根据权利要求5所述的方法,其特征在于,所述为所述视频文件构建索引,包括:确定所述视频文件中需要构建索引的目标时间点;获取所述目标时间点对应的视频片段;对所述视频片段进行内容识别,以获得所述视频片段包含的内容;根据所述视频片段包含的内容,生成所述目标时间点对应的索引。7.根据权利要求6所述的方法,其特征在于,所述确定所述视频文件中需要构建索引的目标时间点,包括:按照预设的索引构建周期,确定所述视频文件中需要构建索引的目标时间点;或者按照预设的需要构建索引的时间点数量,确定所述视频文件中需要构建索引的目标时间点。8.根据权利要求6所述的方法,其特征在于,所述对所述视频片段进行内容识别,以获得所述视频片段包含的内容,包括:对所述视频片段进行人脸识别和语音识别,以获得所述视频片段中的人脸图像和语音内容。9.根据权利要求8所述的方法,其特征在于,所述根据所述视频片段包含的内容,生成所述目标时间点对应的索引,包括:根据所述视频片段中的人脸图像和语音内容,生成所述视频片段的文字介绍;将所述文字介绍整合在所述视频片段中以作为所述目标时间点对应的索引。10.根据权利要求5所述的方法,其特征在于,所述为所述视频文件构建索引,包括:在录制所述视频文件的过程中,为所述视频文件构建索引;或者在回放所述视频文件的过程中,为所述视频文件构建索...

【专利技术属性】
技术研发人员:郭晓亮
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1