齿音识别、消除方法、系统、介质及设备技术方案

技术编号：39179855 阅读：12 留言：0更新日期：2023-10-27 08:27

一种齿音识别、消除方法、系统、介质及设备，识别方法包括通过深度学习方式获取音频信号的齿音判断值，所述齿音判断值包括第一齿音判断值和第二齿音判断值；根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。本申请的齿音识别方法通过深度学习方式获取音频信号中的齿音判断值，齿音判断值包括第一齿音判断值和第二齿音判断值，并使用第一齿音判断值和第二齿音判断值中的至少一种进行齿音判断以识别出音频信号中的齿音信号，提高了齿音信号识别的准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
齿音识别、消除方法、系统、介质及设备

[0001]本申请涉及电子
，具体涉及一种齿音识别、消除方法、系统、介质及设备。

技术介绍

[0002]当音乐中或视频中的字声母是j、q、x、zh、ch、sh、z、c、s时，由于在发这些音时演唱者舌尖需要顶住上门牙，气流和牙齿会发生摩擦，因此会产生齿音。齿音属于边缘音，没有固定基频，所以在语谱图中呈现出的是一片雾状物。齿音的频率主要在4KHz(赫兹)
‑
8KHz左右，属于人耳听觉的敏感区域，因此当齿音较大时听起来会比较刺耳，有明显的刺耳感，导致音乐整体听感不好。
[0003]现有技术中多使用单个特征信息进行声音信号分析，导致齿音识别的准确度较低。

技术实现思路

[0004]鉴于此，本申请提供一种齿音识别、消除方法、系统、介质及设备，以解决现有的使用单个特征信息进行声音信号分析，导致齿音识别的准确度较低的问题。
[0005]本申请提供的一种齿音识别方法，包括：通过深度学习方式获取音频信号的齿音判断值，所述齿音判断值包括第一齿音判断值和第二齿音判断值；根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。
[0006]可选的，所述根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号的步骤，包括：当根据所述第一齿音判断值识别所述音频信号中的齿音信号时，在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号；当根据所述第二齿音判断值识别所述音频信号中的齿音...

【技术保护点】

【技术特征摘要】
1.一种齿音识别方法，其特征在于，包括：通过深度学习方式获取音频信号的齿音判断值，所述齿音判断值包括第一齿音判断值和第二齿音判断值；根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号。2.如权利要求1所述的齿音识别方法，其特征在于，所述根据所述第一齿音判断值和所述第二齿音判断值中的至少一个识别所述音频信号中的齿音信号的步骤，包括：当根据所述第一齿音判断值识别所述音频信号中的齿音信号时，在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号；当根据所述第二齿音判断值识别所述音频信号中的齿音信号时，在所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号；当根据所述第一齿音判断值和所述第二齿音判断值识别所述音频信号中的齿音信号时，在所述第二齿音判断值小于所述第二判断阈值时，获取所述第二齿音判断值对应的音频信号的第一齿音判断值；在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号。3.如权利要求2所述的齿音识别方法，其特征在于，所述第一齿音判断值包括齿音幅值和齿音幅值比例，所述齿音幅值比例通过对所述齿音幅值进行归一化处理得到；所述第一判断阈值包括第一幅值阈值和第一幅值比例阈值；所述在所述第一齿音判断值大于第一判断阈值时认定所述音频信号为齿音信号的步骤，包括：在所述齿音幅值大于所述第一幅值阈值或所述齿音幅值比例大于所述第一幅值比例阈值时认定所述音频信号为齿音信号。4.如权利要求3所述的齿音识别方法，其特征在于，所述第二齿音判断值包括齿音预测值和齿音识别比例，所述齿音预测值的大小与所述齿音信号的大小正相关，所述齿音识别比例通过对所述齿音预测值进行归一化处理得到；所述第二判断阈值包括第一预测阈值和第一识别比例阈值；所述第二齿音判断值大于第二判断阈值时认定所述音频信号为齿音信号的步骤，包括：在所述齿音预测值大于所述第一预测阈值或所述齿音识别比例大于所述第一识别比例阈值时认定所述音频信号为齿音信号。5.如权利要求4所述的齿音识别方法，其特征在于，所述第三判断阈值包括第二幅值阈值和第二幅值比例阈值；所述在所述第二齿音判断值小于所述第二判断阈值时，获取所述第二齿音判断值对应的音频信号的第一齿音判断值；在所述第一齿音判断值大于第三判断阈值时认定所述音频信号为齿音信号的步骤，包括：在所述齿音预测值小于所述第一预测阈值或所述齿音识别比例小于所述第一识别比例阈值时，继续获取对应音频信号的齿音幅值或齿音幅值比例，在所述齿音幅值大于所述第二幅值阈值或所述齿音幅值比例大于所述第二幅值比例阈值时，认定所述音频信号为齿音信号。
6.如权利要求1所述的齿音识别方法，其特征在于，所述通过深度学习方式获取音频信号的齿音判断值的步骤，包括：通过卷积神经网络模型、深度神经网络模型、循环...

【专利技术属性】
技术研发人员：陈修凯，李建华，朱马，
申请(专利权)人：上海艾为电子技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人