齿音识别、消除方法、系统、介质及设备技术方案

技术编号:39179855 阅读:12 留言:0更新日期:2023-10-27 08:27
一种齿音识别、消除方法、系统、介质及设备,识别方法包括通过深度学习方式获取音频信号的齿音判断值,所述齿音判断值包括第一齿音判断值和第二齿音判断值;根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。本申请的齿音识别方法通过深度学习方式获取音频信号中的齿音判断值,齿音判断值包括第一齿音判断值和第二齿音判断值,并使用第一齿音判断值和第二齿音判断值中的至少一种进行齿音判断以识别出音频信号中的齿音信号,提高了齿音信号识别的准确度。确度。确度。

【技术实现步骤摘要】
齿音识别、消除方法、系统、介质及设备


[0001]本申请涉及电子
,具体涉及一种齿音识别、消除方法、系统、介质及设备。

技术介绍

[0002]当音乐中或视频中的字声母是j、q、x、zh、ch、sh、z、c、s时,由于在发这些音时演唱者舌尖需要顶住上门牙,气流和牙齿会发生摩擦,因此会产生齿音。齿音属于边缘音,没有固定基频,所以在语谱图中呈现出的是一片雾状物。齿音的频率主要在4KHz(赫兹)

8KHz左右,属于人耳听觉的敏感区域,因此当齿音较大时听起来会比较刺耳,有明显的刺耳感,导致音乐整体听感不好。
[0003]现有技术中多使用单个特征信息进行声音信号分析,导致齿音识别的准确度较低。

技术实现思路

[0004]鉴于此,本申请提供一种齿音识别、消除方法、系统、介质及设备,以解决现有的使用单个特征信息进行声音信号分析,导致齿音识别的准确度较低的问题。
[0005]本申请提供的一种齿音识别方法,包括:通过深度学习方式获取音频信号的齿音判断值,所述齿音判断值包括第一齿音判断值和第二齿音判断值;根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。
[0006]可选的,所述根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号的步骤,包括:当根据所述第一齿音判断值识别所述音频信号中的齿音信号时,在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号;当根据所述第二齿音判断值识别所述音频信号中的齿音信号时,在所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号;当根据所述第一齿音判断值和所述第二齿音判断值识别所述音频信号中的齿音信号时,在所述第二齿音判断值小于所述第二判断阈值时,获取所述第二齿音判断值对应的音频信号的第一齿音判断值;在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号。
[0007]可选的,所述第一齿音判断值包括齿音幅值和齿音幅值比例,所述齿音幅值比例通过对所述齿音幅值进行归一化处理得到;所述第一判断阈值包括第一幅值阈值和第一幅值比例阈值;所述在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音幅值大于所述第一幅值阈值或所述齿音幅值比例大于所述第一幅值比例阈值时认定所述音频信号为齿音信号。
[0008]可选的,所述第二齿音判断值包括齿音预测值和齿音识别比例,所述齿音预测值的大小与所述齿音信号的大小正相关,所述齿音识别比例通过对所述齿音预测值进行归一化处理得到;所述第二判断阈值包括第一预测阈值和第一识别比例阈值;所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音预测值大于所述第一预测阈值或所述齿音识别比例大于所述第一识别比例阈值时认定所述音频
信号为齿音信号。
[0009]可选的,所述第三判断阈值包括第二幅值阈值和第二幅值比例阈值;
[0010]所述在所述第二齿音判断值小于所述第二判断阈值时,获取所述第二齿音判断值对应的音频信号的第一齿音判断值;在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音预测值小于所述第一预测阈值或所述齿音识别比例小于所述第一识别比例阈值时,继续获取对应音频信号的齿音幅值或齿音幅值比例,在所述齿音幅值大于所述第二幅值阈值或所述齿音幅值比例大于所述第二幅值比例阈值时,认定所述音频信号为齿音信号。
[0011]可选的,所述通过深度学习方式获取音频信号的齿音判断值的步骤,包括:通过卷积神经网络模型、深度神经网络模型、循环神经网络模型和支持向量机模型中的至少一种获取音频信号的齿音判断值。
[0012]可选的,所述归一化处理包括使用线性归一化公式进行归一化处理;所述线性归一化公式为:
[0013][0014]其中,x为所述音频信号、f(x)为所述齿音预测值、f(x)
min
为所述齿音预测值中的最小值、f(x)
max
为所述齿音预测值中的最大值、g(x)为所述齿音识别比例。
[0015]本申请还提供一种齿音消除方法,包括:使用所述的齿音识别方法识别出所述音频信号中的齿音信号;对所述齿音信号的幅值进行压制以消除所述齿音信号。
[0016]可选的,所述对所述齿音信号的幅值进行压制以消除所述齿音信号的步骤具体包括:在所述第一齿音判断值大于第一判断阈值时,以第一增益值对所述齿音信号的幅值进行压制;在所述第二齿音判断值大于第二判断阈值时,以第二增益值对所述齿音信号的幅值进行压制;在所述第二齿音判断值小于所述第二判断阈值时,实时获取所述第一齿音判断值,并根据所述第一齿音判断值的大小控制齿音压制时的增益值以实现动态齿音压制。
[0017]可选的,所述根据所述第一齿音判断值的大小控制齿音压制时的增益值以实现动态齿音压制的步骤,包括:在第一齿音判断值大于第三判断阈值且小于第四判断阈值时,以第三增益值对所述齿音信号的幅值进行压制;在第一齿音判断值小于第三判断阈值时,以第四增益值对所述齿音信号的幅值进行压制;在第一齿音判断值大于第四判断阈值时,以第五增益值对所述齿音信号的幅值进行压制。
[0018]本申请还提供一种齿音识别系统,包括:信号获取模块,用于通过深度学习方式获取音频信号的齿音判断值,所述齿音判断值包括第一齿音判断值和第二齿音判断值;齿音识别模块,用于根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。
[0019]本申请还提供一种齿音消除系统,包括所述的齿音识别系统以识别出所述音频信号中的齿音信号;所述齿音消除系统还包括:
[0020]齿音压制模块,用于对所述齿音信号的幅值进行压制以消除所述齿音信号。
[0021]本申请还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的齿音识别方法,或,所述计算机程序被处理器执行时实现所述的齿音消除方法。
[0022]本申请还提供一种电子设备,包括处理器和存储介质;所述存储介质上存储有程序代码;所述处理器用于调用所述存储介质存储的程序代码,以执行所述的齿音识别方法,或,所述的齿音消除方法。
[0023]本申请的齿音识别方法、系统、介质及设备,通过深度学习方式获取音频信号中的齿音判断值,齿音判断值包括第一齿音判断值和第二齿音判断值,并使用第一齿音判断值和第二齿音判断值中的至少一种进行齿音判断以识别出音频信号中的齿音信号,提高了齿音信号识别的准确度。
[0024]进一步的,使用第一齿音判断值和第二齿音判断值进行齿音判断,并设置多个阈值进行细分比较,进一步提高了齿音信号识别的准确度。
[0025]本申请的齿音消除方法,在使用上述齿音识别方法识别出齿音信号后,再对该齿音信号进行幅值压制以消除齿音,由于本申请的齿音消除方法是先检测出来齿音信号,并仅仅对齿音信号进行幅值压制,对非齿音部分不进行压制,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种齿音识别方法,其特征在于,包括:通过深度学习方式获取音频信号的齿音判断值,所述齿音判断值包括第一齿音判断值和第二齿音判断值;根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。2.如权利要求1所述的齿音识别方法,其特征在于,所述根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号的步骤,包括:当根据所述第一齿音判断值识别所述音频信号中的齿音信号时,在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号;当根据所述第二齿音判断值识别所述音频信号中的齿音信号时,在所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号;当根据所述第一齿音判断值和所述第二齿音判断值识别所述音频信号中的齿音信号时,在所述第二齿音判断值小于所述第二判断阈值时,获取所述第二齿音判断值对应的音频信号的第一齿音判断值;在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号。3.如权利要求2所述的齿音识别方法,其特征在于,所述第一齿音判断值包括齿音幅值和齿音幅值比例,所述齿音幅值比例通过对所述齿音幅值进行归一化处理得到;所述第一判断阈值包括第一幅值阈值和第一幅值比例阈值;所述在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音幅值大于所述第一幅值阈值或所述齿音幅值比例大于所述第一幅值比例阈值时认定所述音频信号为齿音信号。4.如权利要求3所述的齿音识别方法,其特征在于,所述第二齿音判断值包括齿音预测值和齿音识别比例,所述齿音预测值的大小与所述齿音信号的大小正相关,所述齿音识别比例通过对所述齿音预测值进行归一化处理得到;所述第二判断阈值包括第一预测阈值和第一识别比例阈值;所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音预测值大于所述第一预测阈值或所述齿音识别比例大于所述第一识别比例阈值时认定所述音频信号为齿音信号。5.如权利要求4所述的齿音识别方法,其特征在于,所述第三判断阈值包括第二幅值阈值和第二幅值比例阈值;所述在所述第二齿音判断值小于所述第二判断阈值时,获取所述第二齿音判断值对应的音频信号的第一齿音判断值;在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号的步骤,包括:在所述齿音预测值小于所述第一预测阈值或所述齿音识别比例小于所述第一识别比例阈值时,继续获取对应音频信号的齿音幅值或齿音幅值比例,在所述齿音幅值大于所述第二幅值阈值或所述齿音幅值比例大于所述第二幅值比例阈值时,认定所述音频信号为齿音信号。
6.如权利要求1所述的齿音识别方法,其特征在于,所述通过深度学习方式获取音频信号的齿音判断值的步骤,包括:通过卷积神经网络模型、深度神经网络模型、循环...

【专利技术属性】
技术研发人员:陈修凯李建华朱马
申请(专利权)人:上海艾为电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1