基于自注意力的音频美化方法、装置、设备及存储介质制造方法及图纸

技术编号：38563318 阅读：10 留言：0更新日期：2023-08-22 21:02

本发明专利技术公开了一种基于自注意力的音频美化方法，该方法包括获取待处理音频；获取音频模型，对所有待处理音频进行内容提取，得到音频内容；对所有待处理音频进行音色提取，得到音频音色；对所有所述待处理音频进行能量提取，得到音频能量；将音频内容、音频音色和音频能量进行连接，得到音频特征；通过音频模型编码端对音频特征进行编码处理，得到编码特征；获取标准音频特征以及音频音高，通过音频模型解码端对标准音频特征、编码特征以及音频音高进行解码，得到美化音频。本发明专利技术通过在训练过程中采用训练加测试，使得整体的模型具有轻量化。通过引入位置嵌入和注意力机制，提高了模型的鲁棒性。引入能量特征并隐形表示，改善了音频质量。音频质量。音频质量。

全部详细技术资料下载

【技术实现步骤摘要】
基于自注意力的音频美化方法、装置、设备及存储介质

[0001]本专利技术涉及语音处理
，尤其涉及一种基于自注意力的音频美化方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的不断的发展，数字音乐已经在网络上掀起了一轮又一轮的热潮。然而，绝大部分普通人由于技巧的欠缺导致发出的声音不太令人满意。因此，对音频进行美化是极其重要的。
[0003]现有技术中，对原始音频进行美化包括音高校准和音色美化两部分，现有的模型均是以生成式模型(CVAE)为主体，仅仅只能提取局部特征且感受野较小。而对音色的改变只是简单的线性处理，并不能很好地改善音质。再通过合成器将音高校准和音色美化后的音频进行融合，但合成音频质量不高，导致音频美化程度较低。

技术实现思路

[0004]本专利技术实施例提供一种基于自注意力的音频美化方法、装置、设备及存储介质，以解决现有技术中音频美化程度较低的问题。
[0005]一种基于自注意力的音频美化方法，包括：
[0006]获取至少一个待处理音频；
[0007]获取音频模型，通过所述音频模型中内容编码器对所有所述待处理音频进行内容提取，得到与各所述待处理音频对应的音频内容；
[0008]通过所述音频模型中音色编码器对所有所述待处理音频进行音色提取，得到与各所述待处理音频对应的音频音色；
[0009]通过所述音频模型中能量编码器对所有所述待处理音频进行能量提取，得到与各所述待处理音频对应的音频能量；
[0010]对所述音频内容、所述...

【技术保护点】

【技术特征摘要】
1.一种基于自注意力的音频美化方法，其特征在于，包括：获取至少一个待处理音频；获取音频模型，通过所述音频模型中内容编码器对所有所述待处理音频进行内容提取，得到与各所述待处理音频对应的音频内容；通过所述音频模型中音色编码器对所有所述待处理音频进行音色提取，得到与各所述待处理音频对应的音频音色；通过所述音频模型中能量编码器对所有所述待处理音频进行能量提取，得到与各所述待处理音频对应的音频能量；对所述音频内容、所述音频音色和所述音频能量进行位置嵌入，得到音频特征；通过所述音频模型的编码端对所述音频特征进行编码处理，得到编码特征；获取标准音频特征以及音频音高，通过所述音频模型的解码端对所述标准音频特征、所述编码特征以及所述音频音高进行解码，得到美化音频。2.如权利要求1所述的基于自注意力的音频美化方法，其特征在于，所述通过所述音频模型中内容编码器对所有所述待处理音频进行内容提取，得到与各所述待处理音频对应的音频内容，包括：通过所述内容编码器中下采样层对所述待处理音频进行采样处理，得到下采样特征；通过所述内容编码器中注意力层对所述下采样特征进行注意力处理，得到注意力特征；通过所述内容编码器中卷积层对所述注意力特征进行卷积处理，得到音频内容。3.如权利要求1所述的基于自注意力的音频美化方法，其特征在于，所述对所述音频内容、所述音频音色和所述音频能量进行位置嵌入，得到音频特征，包括：对所述音频内容、所述音频音色和所述音频能量进行位置嵌入，得到与所述音频内容对应的内容位置向量、与所述音频音色对应的音色位置向量和与所述音频能量对应的能量位置向量；通过所述内容位置向量、所述音色位置向量和所述能量位置向量对所述音频内容、所述音频音色和所述音频能量进行连接，得到音频特征。4.如权利要求1所述的基于自注意力的音频美化方法，其特征在于，所述获取音频音高之前，包括：获取音高预测器，通过所述音高预测器中第一卷积层对所述待处理音频进行一维卷积处理，得到第一卷积特征；通过所述音高预测器中第二卷积层对所述第一卷积特征进行卷积处理，得到第二卷积特征；通过所述音高预测器中第三卷积层对所述第二卷积特征进行一维卷积处理，得到音频音高。5.如权利要求1所述的基于自注意力的音频美化方法，其特征在于，所述获取音频模型之前，包括：获取样本训练数据集，所述样本训练数据集包括至少一个样本训练数据；一个所述样本训练数据对应一个样本标签；获取预设训练模型，通...

【专利技术属性】
技术研发人员：张旭龙，王健宗，程宁，季圣鹏，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人