音频信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32861985 阅读:52 留言:0更新日期:2022-03-30 19:44
本申请公开了一种音频信息处理方法:获取样本音频和检材音频;对样本音频和检材音频进行语音分段处理,得到样本音段信息和检材音段信息;根据音段匹配规则对样本音频和检材音频进行音段匹配,若样本音频和检材音频之间存在至少一组匹配音段,则将每组匹配音段作为匹配音段组;根据样本音段信息和检材音段信息对每个匹配音段组进行音段频次计算得到音段频次;根据样本音段信息和检材音段信息对每个匹配音段组进行相似度计算得到每个匹配音段组的相似度评分;根据音段频次和相似度评分,确定检材音频和样本音频的特征音段。本方法通过对样本音频和检材音频中的匹配音段组进行音段频次统计和相似度评分计算,提高了获取特征音频的效率。频的效率。频的效率。

【技术实现步骤摘要】
音频信息处理方法、装置、电子设备及存储介质


[0001]本申请涉及语音处理
,更具体地,涉及一种音频信息处理方法、装置、电子设备及存储介质。

技术介绍

[0002]声纹鉴定(Voice Identification)作为生物识别技术的一种,又称为语音同一性鉴定,在鉴定过程中需要从比对的两个音频中选取特征相符的语音片段进行声纹图谱的比对与分析,以便确定符合比对条件的语音片段,也即特征音段。
[0003]实际工作中,特征音段的提取大多是基于鉴定专家的人工听辨分析,由于在听辨过程中必须对待分析的音频进行反复听辨和筛选,因此这种传统的经人工挑选特征音段来进行声纹鉴定的方法效率低下,并且准确性容易受不同鉴定人的经验能力的制约,从而为声纹鉴定的相关应用带来不便。

技术实现思路

[0004]本申请实施例提供一种音频信息处理方法、装置、电子设备及存储介质,旨在提升特征音段的提取的效率和准确性。
[0005]第一方面,本申请实施例提供一种音频信息处理方法,该方法包括:获取样本音频和检材音频;对样本音频和检材音频进行语音分段处本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频信息处理方法,其特征在于,所述方法包括:获取样本音频和检材音频;对所述样本音频和所述检材音频进行语音分段处理,得到所述样本音频对应的样本音段信息和所述检材音频对应的检材音段信息,所述样本音段信息和所述检材音段信息都包括音素信息,所述音素信息关联有对应的时间戳;根据音段匹配规则对所述样本音频和所述检材音频进行音段匹配,若所述样本音频和所述检材音频之间存在至少一组匹配音段,则将每组所述匹配音段作为匹配音段组,所述匹配音段组分别由所述检材音频和所述样本音频中符合匹配规则的音段组成;根据所述样本音段信息和所述检材音段信息对每个所述匹配音段组进行音段频次计算,得到音段频次;根据所述样本音段信息和所述检材音段信息对每个所述匹配音段组进行相似度计算,得到每个所述匹配音段组的相似度评分;根据所述音段频次和所述相似度评分,确定所述检材音频和所述样本音频的特征音段。2.根据权利要求1所述的方法,其特征在于,所述匹配规则包括相同音段匹配规则和相近音段匹配规则,所述匹配音段组包括相同匹配音段组和相近匹配音段组,所述根据音段匹配规则对所述样本音频和所述检材音频进行音段匹配,若所述样本音频和所述检材音频之间存在至少一组匹配音段,则将每组所述匹配音段作为匹配音段组,包括:根据相同音段匹配规则,对所述样本音频和所述检材音频进行音段信息匹配,若所述样本音频和所述检材音频之间存在至少一组相同的匹配音段,则将所述相同的匹配音段作为相同匹配音段组;根据相近音段匹配规则,对所述样本音频和所述检材音频进行音段信息匹配,若所述样本音频和所述检材音频之间存在至少一组相近的匹配音段,则将所述相近的匹配音段作为相近匹配音段组。3.根据权利要求2所述的方法,其特征在于,所述根据相同音段匹配规则,对所述样本音频和所述检材音频进行音段信息匹配,若所述样本音频和所述检材音频之间存在至少一组相同的匹配音段,则将所述相同的匹配音段作为相同匹配音段组,包括:根据相同音段匹配规则,对所述样本音频和所述检材音频进行音素信息的匹配,判断所述样本音频和所述检材音频是否存在相同音素信息的音段;若所述样本音频和所述检材音频存在至少一组相同音素信息的音段,则将所述样本音频和所述检材音频中具有相同音素信息的每组匹配音段作为所述相同匹配音段组。4.根据权利要求2所述的方法,其特征在于,所述根据相近音段匹配规则,对所述样本音频和所述检材音频进行音段信息匹配,若所述样本音频和所述检材音频之间存在至少一组相近的匹配音段,则将所述相近的匹配音段作为相近匹配音段组,包括:根据相近音段匹配规则,对所述样本音频和所述检材音频进行音素信息匹配,判断所述样本音频和所述检材音频是否存在相近音素信息的音段;若所述样本音频和所述检材音频存在至少一组相近音素信息的音段,则将所述样本音频和所述检材音频中具有相近音素信息的每组匹配音段作为所述相近匹配音段组。5.根据权利要求1所述的方法,其特征在于,所述根据所述样本音段信息和所述检材音
段信息对每个所述匹配音段组进行音段频次计算,得到音段频次,包括:根据所述样本音段信息和所述检材音段信息,检索每个所述匹配音段组中的相同音素信息和相同文本信息;计算所述样本音频和所述检材音频中包含所述相同音素信息和所述相同文本信息的音段,并确定所述音段同时出现在每个所述匹配音段组中的音段频次。6.根据权利要求1所述的方法,其特征在于,所述根据所述样本音段信息和所述检材音段信息对每个所述匹配音段组进行相似度计算,得到每个所述匹配音段组的相似度评分,包括:基于同一时间戳,在每个所述匹配音段组中分别确定对应的待测样本音段和待测检材音段;根据所述样本音段信息和所述检材音段信息,对所述待测样本音段和所述待测检材音段进行相似度计算,得到每个所述匹配音段组的相似度...

【专利技术属性】
技术研发人员:李亚桐丁俊豪
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1