音频处理方法技术

技术编号：39869010 阅读：18 留言：0更新日期：2023-12-30 12:58

本申请提供一种音频处理方法

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、电子设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种音频处理方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]随着多媒体通信技术及人工智能的发展，语音合成和语音识别技术已成为人机语音通信的关键技术
。
在一些应用场景下，出于保密性
、
个性化等具体的应用需求，需要通过音频处理技术对用户输入的语音进行处理
。
[0003]在相关技术中，上述音频处理技术可以通过机器学习模型来实现，而该实现音频处理的模型往往是部署在网络侧的，这使得用户需要依赖于网络通信服务，通过在线的方式使用音频处理服务
。
然而，网络通信服务普遍具有延时性和不稳定性等缺点，并且在一些场景下，用户可能根本无法使用网络通信服务，上述情况均会造成用户无法正常有效的使用音频处理服务
。

技术实现思路

[0004]有鉴于此，本申请的目的在于提出一种音频处理方法
、
装置/>、
电子本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种音频处理方法，其特征在于，包括：获取待处理音频数据；将所述待处理音频数据输入预先训练的声学特征提取模型，得到所述待处理音频数据对应的待处理声学特征；所述待处理声学特征包括至少部分所述待处理音频数据的发音方式特征；将所述待处理声学特征输入预先训练的音频处理模型，得到具有目标音色且与所述待处理音频数据对应的处理后音频数据
。2.
根据权利要求1所述的方法，其特征在于，所述方法还包括通过以下方法训练所述声学特征提取模型：获取第一音频数据；根据预定的语音识别模型，生成所述第一音频数据对应的第一声学特征；所述第一声学特征是由所述语音识别模型中靠近输出层的任一隐层输出的；根据所述第一音频数据和所述第一声学特征，生成第一训练数据集；获取声学特征提取模型；所述声学特征提取模型的大小小于所述语音识别模型的大小；根据所述第一训练数据集，训练所述声学特征提取模型
。3.
根据权利要求2所述的方法，其特征在于，所述根据预定的语音识别模型，生成所述第一音频数据对应的第一声学特征，包括：将所述第一音频数据输入所述语音识别模型，提取所述语音识别模型中与输出层紧邻的一个隐层的输出作为所述第一音频数据对应的第一声学特征
。4.
根据权利要求2所述的方法，其特征在于，所述声学特征提取模型包括的隐层的数量不超过所述语音识别模型包括的隐层的数量的五分之一；对于所述声学特征提取模型的任一隐层，该隐层包括的神经元的数量不超过所述语音识别模型的任一隐层包括的神经元的数量的四分之一
。5.
根据权利要求1所述的方法，其特征在于，所述方法还包括通过以下方法训练所述音频处理模型：获取具有目标音色的第二音频数据；将所述第二音频数据输入所述声学特征提取模型，得到所述第二音频数据对应的第二...

【专利技术属性】
技术研发人员：汤本来，李忠豪，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人