程度可控的深度学习语音处理模型构建方法及装置制造方法及图纸

技术编号：39898107 阅读：6 留言：0更新日期：2023-12-30 13:11

本发明专利技术实施例提供一种程度可控的深度学习语音处理模型构建方法及装置方法及装置，所述方法包括：获取语音数据的处理类型及对应数据库中的原始数据及处理后数据；根据处理类型获取对应的目标控制系数

全部详细技术资料下载

【技术实现步骤摘要】
程度可控的深度学习语音处理模型构建方法及装置

[0001]本专利技术涉及语音处理
，尤其涉及一种程度可控的深度学习语音处理模型构建方法及装置
。

技术介绍

[0002]当今，随着人工智能的发展，基于深度学习的语音处理模型的应用场景越来越广泛，该领域的研究以及应用也进一步扩展
。
因深度学习模型具有学习
、
推理等强大能力，语音处理模型在身份识别
、
声音信息提取
、
语音脱敏等各种场景下得到大量应用
。
[0003]然而，目前的语音处理模型在处理语音数据时，处理的结果准确性并不高，因为在语音处理时存在处理程度不可控的缺点，灵活性不足的问题
。

技术实现思路

[0004]针对现有技术中存在的问题，本专利技术实施例提供一种程度可控的深度学习语音处理模型构建方法及装置
。
[0005]本专利技术实施例提供一种程度可控的深度学习语音处理模型构建方法，包括：
[0006]获取语音数据，确定所述语音数据的处理类型，并根据所述处理类型获取对应类型的数据库，获取所述数据库中的原始数据及处理后数据；
[0007]根据所述处理类型获取对应的目标控制系数，根据所述目标控制系数及原始数据得到目标数据；
[0008]根据所述原始数据及处理后数据确定对应的实际控制系数，将所述原始数据
、
控制系数
、
处理后数据及目标数据输入到神经网络模型进行训练，得到训练...

【技术保护点】

【技术特征摘要】
1.
一种程度可控的深度学习语音处理模型构建方法，其特征在于，包括：获取语音数据，确定所述语音数据的处理类型，并根据所述处理类型获取对应类型的数据库，获取所述数据库中的原始数据及处理后数据；根据所述处理类型获取对应的目标控制系数，根据所述目标控制系数及原始数据得到目标数据；根据所述原始数据及处理后数据确定对应的实际控制系数，将所述原始数据
、
控制系数
、
处理后数据及目标数据输入到神经网络模型进行训练，得到训练后的神经网络模型，所述训练包括以所述实际控制系数和处理后数据为训练反馈，使训练结果趋近于所述目标数据；接收到待检测语音数据时，根据所述待检测语音数据的处理类型确定对应的训练后的神经网络模型，并将所述待检测语音数据输入神经网络模型，得到所述神经网络模型输出的待检测语音数据对应控制系数
。2.
根据权利要求1所述的程度可控的深度学习语音处理模型构建方法，其特征在于，所述将原始数据
、
控制系数
、
处理后数据及目标数据输入到神经网络模型进行训练，包括：通过所述原始数据及实际控制系数得到对应的语音特征，所述卷积神经网络的
N
个一维卷积层依次对所述语音特征进行降采样，得到对应的降采样矩阵；通过所述卷积神经网络的
N
个一维卷积层依次对所述降采样矩阵进行升采样，得到一维卷积函数；通过所述一维卷积函数得到训练后数据，将所述训练后数据与处理后数据进行数据对比，得到对比结果，以所述实际控制系数和处理后数据为训练反馈，重复步骤
a、b、c
，直至所述对比结果趋近于所述目标控制系数
。3.
根据权利要求2所述的程度可控的深度学习语音处理模型构建方法，其特征在于，所述神经网络模型，还包括：对进行降采样的
N
个一维卷积层与进行升采样的
N
个一维卷积层进行对应标号，并在相同标号的一维卷积层之间设置短路模块
。4.
根据权利要求1所述的程度可控的深度学习语音处理模型构建方法，其特征在于，所述得到训练后的神经网络模型之后，还包括：获取语音数据对应的数据范围，将所述训练后的神经网络模型与所述处理类型及数据范围对应保存
。5.
根据权利要求1所述的程度可控的深度学习语音处理模型构建方法，其特征在于，所述处理类型，包括：身份识别
、
声音信息提取
、
语音脱敏
。6.
一...

【专利技术属性】
技术研发人员：陈艳姣，徐文渊，邓江毅，钟奕楠，程雨诗，
申请(专利权)人：杭州涿溪脑与智能研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人