音频处理方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：37426033 阅读：42 留言：0更新日期：2023-04-30 09:47

本申请实施例提供了一种音频处理方法、装置、设备、存储介质及程序产品，涉及音频技术领域。所述方法包括：获取第一音频文件(110)；提取所述第一音频文件的音频特征(120)；通过第一用户的声学模型对所述音频特征进行处理，生成第二音频文件；其中，所述第一用户的声学模型是学习有所述第一用户的声学特征的模型，所述第二音频文件具有所述第一用户的音色(130)。采用本申请实施例提供的技术方案，能够提升音频内容的丰富性。提升音频内容的丰富性。提升音频内容的丰富性。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】音频处理方法、装置、设备、存储介质及程序产品

[0001]本申请实施例涉及音频
，特别涉及一种音频处理方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前，随着音频技术的发展，音频处理方式越来越多种多样。
[0003]在相关技术中，用户可以通过某个音频制作应用程序给自己录音、调音并播放制作的音频。
[0004]在上述相关技术中，用户只能采用自己录音得到的音频进行音频制作，制作得到的音频内容较为单一。

技术实现思路

[0005]本申请实施例提供了一种音频处理方法、装置、设备、存储介质及程序产品，能够提升音频内容的丰富性。所述技术方案如下：
[0006]根据本申请实施例的一个方面，提供了一种音频处理方法，所述方法包括：
[0007]显示第一音频文件的相关信息；
[0008]响应于针对所述第一音频文件的音色制作指令，显示通过第一用户的声学模型根据所述第一音频文件生成的第二音频文件；其中，所述第一用户的声学模型是学习有所述第一用户的声学特征的模型，所述第二音...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音频处理方法，其特征在于，所述方法包括：获取第一音频文件；提取所述第一音频文件的音频特征；通过第一用户的声学模型对所述音频特征进行处理，生成第二音频文件；其中，所述第一用户的声学模型是学习有所述第一用户的声学特征的模型，所述第二音频文件具有所述第一用户的音色。2.根据权利要求1所述的方法，其特征在于，所述音频特征包括以下至少之一：音素特征，用于表征所述第一音频文件中的音频内容的音素信息；音高特征，用于表征所述第一音频文件中的音频内容的音高信息。3.根据权利要求1所述的方法，其特征在于，所述通过第一用户的声学模型对所述音频特征进行处理，生成第二音频文件，包括：通过所述第一用户的声学模型对所述音频特征进行处理，生成梅尔频谱；根据所述梅尔频谱，生成所述第二音频文件。4.根据权利要求3所述的方法，其特征在于，所述声学模型包括编码器和解码器；所述通过所述第一用户的声学模型对所述音频特征进行处理，生成梅尔频谱，包括：通过所述编码器对所述音频特征中的音素特征进行处理，得到编码后的音素特征；其中，所述音素特征用于表征所述第一音频文件中的音频内容的音素信息；将所述编码后的音素特征与所述音频特征中的音高特征进行融合，得到融合特征；通过所述解码器对所述融合特征进行处理，得到所述梅尔频谱。5.根据权利要求4所述的方法，其特征在于，所述将所述编码后的音素特征与所述音频特征中的音高特征进行融合，得到融合特征之后，还包括：从所述融合特征中截取设定长度的切片特征；其中，所述切片特征用于作为所述解码器的输入，得到所述梅尔频谱。6.根据权利要求4所述的方法，其特征在于，所述方法还包括：获取所述第一用户的声纹特征；所述通过所述解码器对所述融合特征进行处理，得到所述梅尔频谱，包括：通过所述解码器对所述融合特征和第一用户的声纹特征进行处理，得到所述梅尔频谱。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述第一用户的音频文件，所述第一用户的音频...

【专利技术属性】
技术研发人员：孙洪文，陈传艺，吴东海，劳振锋，关迪聆，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人