音频处理方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:45344673 阅读:15 留言:0更新日期:2025-05-27 18:59
本申请公开了一种音频处理方法、装置、电子设备及计算机可读介质,涉及音频技术领域,方法包括:获取待处理音频的目标数据段,目标数据段包括连续的第一数量帧的音频数据;将目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征;基于第一频谱特征,得到目标音轨的对应的子音频段。因此,降低每次处理数据的复杂性,降低时延,并且,将音频的复数谱特征作为输入,同时预测幅值和相位,避免带来不必要的时延和算力消耗。

【技术实现步骤摘要】

本申请涉及音频,更具体地,涉及一种音频处理方法、装置、电子设备及计算机可读介质。


技术介绍

1、随着移动终端音频技术的持续发展,空间音频突破了立体声音频的双声道限制,打开了音乐的新维度,大大提升了用户的聆听体验。在音乐场景,声音分离技术能够调节声场方位和音量,或者提取特定声音对象;为用户提供具有自主创造音效风格能力的自定义功能,提高用户的参与感,可玩性,扩展了音频的体验边界。


技术实现思路

1、本申请提出了一种音频处理方法、装置、电子设备及计算机可读介质,以改善上述缺陷。

2、第一方面,本申请提供了一种音频处理方法,包括:获取待处理音频的目标数据段,所述目标数据段包括连续的第一数量帧的音频数据;将所述目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征;基于所述第一频谱特征,得到目标音轨的对应的子音频段。

3、第二方面,本申请还提供了一种音频处理装置,包括:获取单元、提取单元、确定单元、循环单元和合成单元。获取单元,用于获取待处理音频的目标数据本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征,包括:

3.根据权利要求2所述的方法,其特征在于,分轨音乐提取模型包括编码器、中间层和解码器,所述将所述历史模型状态和所述目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述编码器包括N个特征提取网络层和N个下采样层,通过一个特征提取网络层和一个下采样层依次连接的方式,...

【技术特征摘要】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征,包括:

3.根据权利要求2所述的方法,其特征在于,分轨音乐提取模型包括编码器、中间层和解码器,所述将所述历史模型状态和所述目标数据段对应的复数频谱特征输入分轨音乐提取模型,得到目标音轨的复数频谱特征,作为第一频谱特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述编码器包括n个特征提取网络层和n个下采样层,通过一个特征提取网络层和一个下采样层依次连接的方式,将n个特征提取网络层和n个下采样层串接为第一网络串,所述第一模型状态包括每一个特征提取网络层对应的模型状态;所述基于所述第一模型状态和所述目标数据段对应的复数频谱特征,通过所述编码器对所述目标数据段的第一操作,得到第一特征值,包括:

5.根据权利要求4所述的方法,其特征在于,还包括:

6.根据权利要求3所述的方法,其特征在于,所述解码器包括n个特征提取网络层和n个上采样层,通过一个特征提取网络层和一个上...

【专利技术属性】
技术研发人员:张圣张昊旻严锋贵
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1