建立音频检索索引的方法、装置及计算机设备制造方法及图纸

技术编号:20866426 阅读:37 留言:0更新日期:2019-04-17 09:20
本发明专利技术提出了一种建立音频检索索引的方法、装置及计算机设备,其中建立音频检索索引的方法包括:将目标音频分成若干个语音段,其中,每个所述语音段中仅包括一个人物的语音;确定各个语音段所对应的人物;根据各个语音段所对应的不同人物,对各个语音段进行分类;将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引。在建立了音频检索索引之后,用户能够检索出音频内包含有某个特定人物的语音的所有语音段,以及精准确定检索出来的语音段在音频中的具体播放位置,便于用户对音频进行回看或整理。

【技术实现步骤摘要】
建立音频检索索引的方法、装置及计算机设备
本专利技术涉及到索引建立领域,特别是涉及到一种建立音频检索索引的方法、装置及计算机设备。
技术介绍
在现有的音频或者视频文件中,人们如果想要回看音频或者视频中的某一部分,一般都是采用快进或者快退,或者手动拉动进度条,以调整到自己想要回看的部分,这种回看方式只适合于纯粹观看或者只是偶尔回看的场景。当人们需要对音频或者视频中的某一个特定人物所说的话进行检索或者整理时,采用这种回看方式就费时费力,而且效率低下。因此,以上问题亟待解决。
技术实现思路
本专利技术的主要目的为提供一种建立音频检索索引的方法、装置及计算机设备,可以建立音频文件中的各个语音段与目标音频之间的索引关系。本专利技术提出一种建立音频检索索引的方法,包括:将目标音频分成若干个语音段;其中,每个语音段中仅包括一个人物的语音;确定各个语音段所对应的人物;根据各个语音段所对应的不同人物,对各个语音段进行分类;将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频之间建立索引关系,形成音频检索索引。进一步地,将目标音频分成若干个语音段的步骤,包括:识别目标音频中包含的所有原始语音段;对每个原始语音段的起点和终点进行标记,形成若干个语音段。进一步地,确定各个语音段所对应的人物的步骤,包括:在各个语音段之间进行语音特征参数的互相对比;对语音特征参数相同的语音段做同一分类标记。进一步地,在在各个语音段之间进行语音特征参数的互相对比的步骤之前,包括:提取每个语音段的语音特征参数。进一步地,根据各个语音段所对应的不同人物,对各个语音段进行分类的步骤,包括:根据分类标记,对各个语音段进行分类。进一步地,在将分类后的语音段与目标音频进行关联保存,形成音频检索索引的步骤之前,还包括:参照目标音频的原始播放时间,对每个语音段播放时间的信息进行记录;根据记录的播放时间的信息,按照播放时间的先后顺序排列各个分类内的语音段。进一步地,在将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引的步骤之后,还包括:将每个分类内中的每个语音段的语音识别为文字;将文字与对应的语音段进行关联保存。本专利技术还提出了一种建立音频检索索引的装置,包括:分割模块,用于将目标音频分成若干个语音段;其中,每个语音段中仅包括一个人物的语音;确定模块,用于确定各个语音段所对应的人物;分类模块,用于根据各个语音段所对应的不同人物,对各个语音段进行分类;第一保存模块,用于将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引。进一步地,分割模块,包括:识别单元,用于识别目标音频中包含的所有原始语音段;第一标记单元,用于对每个原始语音段的起点和终点进行标记,形成若干个语音段。进一步地,确定模块,包括:对比单元,用于在各个语音段之间进行语音特征参数的互相对比;第二标记单元,用于对语音特征参数相同的语音段做同一分类标记。进一步地,确定模块,还包括:提取单元,用于提取每个语音段的语音特征参数。进一步地,分类模块,包括:分类单元,用于根据分类标记,对各个语音段进行分类。进一步地,还包括:参照模块,用于参照目标音频的原始播放时间,对每个语音段进行播放时间的信息记录;排列模块,用于根据播放时间的信息记录,按照播放时间的先后顺序排列各个分类内的语音段。进一步地,还包括:语音识别模块,用于对每个分类内中的每个语音段进行文字的语音识别;第二保存模块,用于将文字与对应的语音段进行关联保存。本专利技术还提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,其特征在于,处理器执行计算机程序时实现上述中任一项的建立音频检索索引的方法。本专利技术与现有技术相比,有益效果是:本专利技术提出了一种建立音频检索索引的方法、装置及计算机设备,其中建立音频检索索引的方法包括:将目标音频分成若干个语音段;其中,每个语音段中仅包括一个人物的语音;确定各个语音段所对应的人物;根据各个语音段所对应的不同人物,对各个语音段进行分类;将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频之间建立索引关系,形成音频检索索引。在建立了音频检索索引之后,用户能够检索出音频内包含有某个特定人物的语音的所有语音段,以及精准确定检索出来的语音段在音频中的具体播放位置,便于用户对音频进行回看或整理。附图说明图1为本专利技术建立音频检索索引的方法一实施例的步骤示意图;图2为本专利技术建立音频检索索引的装置第一实施例的模块框架示意图;图3为本专利技术建立音频检索索引的装置第二实施例的分割模块的模块框架示意图;图4为本专利技术建立音频检索索引的装置第三实施例的确定模块的模块框架示意图;图5为本专利技术建立音频检索索引的装置第四实施例的确定模块的模块框架示意图;图6为本专利技术建立音频检索索引的装置第五实施例的模块框架示意图;图7为本专利技术建立音频检索索引的装置第六实施例的模块框架示意图;图8为本专利技术建立音频检索索引的装置第七实施例的模块框架示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明,本专利技术实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。另外,在本专利技术中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。如图1所示,本专利技术一实施例中提出了一种建立音频检索索引的方法,包括:S1:将目标音频分成若干个语音段,其中,每个语音段中仅包括一个人物的语音;S2:确定各个语音段所对应的人物;S3:根据各个语音段所对应的不同人物,对各个语音段进行分类;S4:将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引。在上述将目标音频分成若干个语音段,其中,每个语音段中仅包括一个人物的语音的步骤S1中,在包含有人物说话或者其他语音的场景的音频文件中,与一些环境噪声不同的是,人物的说话语音并不会是连续不断的一直说下去,而是由许许多多的停顿以及片段组成整个音频,并且在大多数时候(即人物正常对话或独白的时候),在同一个特定的时间段里,一般都只有一个人物的语音出现,而很少会出现多重语音混杂的场景。因此想要能够在目标音频文件里精准的检索到某个具体的人物所说的语音,首先要把目标本文档来自技高网...

【技术保护点】
1.一种建立音频检索索引的方法,其特征在于,包括:将目标音频分成若干个语音段;其中,每个所述语音段中仅包括一个人物的语音;确定各个所述语音段所对应的人物;根据各个所述语音段所对应的不同人物,对各个所述语音段进行分类;将分类后的所述语音段与所述目标音频进行关联保存,以在所述语音段和所述目标音频之间建立索引关系,形成所述音频检索索引。

【技术特征摘要】
1.一种建立音频检索索引的方法,其特征在于,包括:将目标音频分成若干个语音段;其中,每个所述语音段中仅包括一个人物的语音;确定各个所述语音段所对应的人物;根据各个所述语音段所对应的不同人物,对各个所述语音段进行分类;将分类后的所述语音段与所述目标音频进行关联保存,以在所述语音段和所述目标音频之间建立索引关系,形成所述音频检索索引。2.根据权利要求1所述的建立音频检索索引的方法,其特征在于,所述将目标音频分成若干个语音段的步骤,包括:识别所述目标音频中包含的所有原始语音段;对每个所述原始语音段的起点和终点进行标记,形成若干个所述语音段。3.根据权利要求1所述的建立音频检索索引的方法,其特征在于,所述确定各个所述语音段所对应的人物的步骤,包括:在各个所述语音段之间进行语音特征参数的互相对比;对所述语音特征参数相同的所述语音段做同一分类标记。4.根据权利要求3所述的建立音频检索索引的方法,其特征在于,在所述在各个所述语音段之间进行语音特征参数的互相对比的步骤之前,包括:提取每个所述语音段的所述语音特征参数。5.根据权利要求3所述的建立音频检索索引的方法,其特征在于,所述按照各个所述语音段所对应人物的不同,对各个所述语音段进行分类的步骤,包括:根据所述分类标记,对各个所述语音段进行分类。6.根据权利要求1所述的建立音频检索索引的方法,其特征在于,在所述将分类后的所述语音段与所述目标音频进行关联保存,形成所述音频检索索引的步骤之前,还包...

【专利技术属性】
技术研发人员:郑勇王辉
申请(专利权)人:深圳市沃特沃德股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1