建立音频检索索引的方法、装置及计算机设备制造方法及图纸

技术编号：20866426 阅读：37 留言：0更新日期：2019-04-17 09:20

本发明专利技术提出了一种建立音频检索索引的方法、装置及计算机设备，其中建立音频检索索引的方法包括：将目标音频分成若干个语音段，其中，每个所述语音段中仅包括一个人物的语音；确定各个语音段所对应的人物；根据各个语音段所对应的不同人物，对各个语音段进行分类；将分类后的语音段与目标音频进行关联保存，以在语音段和目标音频间建立索引关系，形成音频检索索引。在建立了音频检索索引之后，用户能够检索出音频内包含有某个特定人物的语音的所有语音段，以及精准确定检索出来的语音段在音频中的具体播放位置，便于用户对音频进行回看或整理。

全部详细技术资料下载

【技术实现步骤摘要】
建立音频检索索引的方法、装置及计算机设备
本专利技术涉及到索引建立领域，特别是涉及到一种建立音频检索索引的方法、装置及计算机设备。
技术介绍
在现有的音频或者视频文件中，人们如果想要回看音频或者视频中的某一部分，一般都是采用快进或者快退，或者手动拉动进度条，以调整到自己想要回看的部分，这种回看方式只适合于纯粹观看或者只是偶尔回看的场景。当人们需要对音频或者视频中的某一个特定人物所说的话进行检索或者整理时，采用这种回看方式就费时费力，而且效率低下。因此，以上问题亟待解决。
技术实现思路
本专利技术的主要目的为提供一种建立音频检索索引的方法、装置及计算机设备，可以建立音频文件中的各个语音段与目标音频之间的索引关系。本专利技术提出一种建立音频检索索引的方法，包括：将目标音频分成若干个语音段；其中，每个语音段中仅包括一个人物的语音；确定各个语音段所对应的人物；根据各个语音段所对应的不同人物，对各个语音段进行分类；将分类后的语音段与目标音频进行关联保存，以在语音段和目标音频之间建立索引关系，形成音频检索索引。进一步地，将目标音频分成若干个语音段的步骤，包括：识别目标音频中包含的所有原始语音段；对每个原始语音段的起点和终点进行标记，形成若干个语音段。进一步地，确定各个语音段所对应的人物的步骤，包括：在各个语音段之间进行语音特征参数的互相对比；对语音特征参数相同的语音段做同一分类标记。进一步地，在在各个语音段之间进行语音特征参数的互相对比的步骤之前，包括：提取每个语音段的语音特征参数。进一步地，根据各个语音段所对应的不同人物，对各个语音段进行分类的步骤，包括：根据分类标记，...

【技术保护点】
1.一种建立音频检索索引的方法，其特征在于，包括：将目标音频分成若干个语音段；其中，每个所述语音段中仅包括一个人物的语音；确定各个所述语音段所对应的人物；根据各个所述语音段所对应的不同人物，对各个所述语音段进行分类；将分类后的所述语音段与所述目标音频进行关联保存，以在所述语音段和所述目标音频之间建立索引关系，形成所述音频检索索引。

【技术特征摘要】
1.一种建立音频检索索引的方法，其特征在于，包括：将目标音频分成若干个语音段；其中，每个所述语音段中仅包括一个人物的语音；确定各个所述语音段所对应的人物；根据各个所述语音段所对应的不同人物，对各个所述语音段进行分类；将分类后的所述语音段与所述目标音频进行关联保存，以在所述语音段和所述目标音频之间建立索引关系，形成所述音频检索索引。2.根据权利要求1所述的建立音频检索索引的方法，其特征在于，所述将目标音频分成若干个语音段的步骤，包括：识别所述目标音频中包含的所有原始语音段；对每个所述原始语音段的起点和终点进行标记，形成若干个所述语音段。3.根据权利要求1所述的建立音频检索索引的方法，其特征在于，所述确定各个所述语音段所对应的人物的步骤，包括：在各个所述语音段之间进行语音特征参数的互相对比；对所述语音特征参数相同的所述语音段做同一分类标记。4.根据权利要求3所述的建立音频检索索引的方法，其特征在于，在所述在各个所述语音段之间进行语音特征参数的互相对比的步骤之前，包括：提取每个所述语音段的所述语音特征参数。5.根据权利要求3所述的建立音频检索索引的方法，其特征在于，所述按照各个所述语音段所对应人物的不同，对各个所述语音段进行分类的步骤，包括：根据所述分类标记，对各个所述语音段进行分类。6.根据权利要求1所述的建立音频检索索引的方法，其特征在于，在所述将分类后的所述语音段与所述目标音频进行关联保存，形成所述音频检索索引的步骤之前，还包...

【专利技术属性】
技术研发人员：郑勇，王辉，
申请(专利权)人：深圳市沃特沃德股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人