一种音频处理方法、音频处理器及相关装置制造方法及图纸

技术编号：41293922 阅读：19 留言：0更新日期：2024-05-13 14:43

本申请提供了一种音频处理方法、音频处理器以及相关装置。本申请实施例可应用于人工智能等各种场景。其方法包括：获取包括K个音频帧的音频序列，将音频序列输入至分组预测网络中，输出L个音频特征组，根据L个音频特征组对应的L个音频组帧数，确定L个音频特征组对应的L个压缩次数，对L个音频特征组进行压缩，得到L个压缩音频特征；对L个压缩音频特征进行编码，得到音频信号对应的L个编码音频。本申请按照音频帧的特征将音频帧进行分组压缩和编码，有效解决了由于固定帧数编码造成的对传输带宽和存储空间的浪费的问题，通过可变帧长的分组压缩和编码的方式，优化了音频信号的压缩方式，减少编码帧输出，降低编码码率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种音频处理方法、音频处理器及相关装置。

技术介绍

1、在常规的音频处理应用中，声音信号经过adc模数转换和音频编码器进行压缩后，可以有效降低存储空间和传输带宽；当音频播放时，来自存储设备或网络传输接收到的压缩音频数据经过对应的音频解码以及dac数模转换后的音频模拟信号，通过硬件播放设备进行播放。

2、现有音频编码器大部分输入帧尺寸在启动编码器的时候被设定和固化，在音频编码过程中不会进行调整，采用固定帧大小的编码方式，每个输入帧对应输出一帧码流，而每一帧码流传输时需要额外增加外层协议信息相关比特空间进行封装，编码输出帧数越多带来的额外比特消耗越大，因此固定帧尺寸的音频编码方式不利于音频信号的进一步压缩，例如，对于网络电话的音频信号进行编码的场景中，由于通话双方或多方都是交互发声，对于通话音频中的大量的非发声段，如静音、小噪声、可被忽略的弱音频信号，若采用与通话音频中的发声段相同的固定帧对通话音频信号进行编码，则会造成传输带宽和存储空间的浪费，因此，采用固定帧大小的编码的方式不利于音频信号的优化压缩。

本文档来自技高网...

【技术保护点】

1.一种音频处理方法，其特征在于，包括：

2.如权利要求1所述的音频处理方法，其特征在于，所述将所述音频序列输入至分组预测网络中，输出L个音频特征组，包括：

3.如权利要求2所述的音频处理方法，其特征在于，所述将所述音频特征序列输入至所述分组预测网络中的组帧预测子网络，包括：

4.如权利要求3所述的音频处理方法，其特征在于，所述组帧预测子网络包括全连接层、第一卷积层、门控层及归一化层；

5.如权利要求2所述的音频处理方法，其特征在于，所述将所述音频序列输入至分组预测网络中，通过所述分组预测网络中的缓存模块将所述K个音频帧依次进行缓存，包括：...

【技术特征摘要】

1.一种音频处理方法，其特征在于，包括：

2.如权利要求1所述的音频处理方法，其特征在于，所述将所述音频序列输入至分组预测网络中，输出l个音频特征组，包括：

3.如权利要求2所述的音频处理方法，其特征在于，所述将所述音频特征序列输入至所述分组预测网络中的组帧预测子网络，包括：

4.如权利要求3所述的音频处理方法，其特征在于，所述组帧预测子网络包括全连接层、第一卷积层、门控层及归一化层；

5.如权利要求2所述的音频处理方法，其特征在于，所述将所述音频序列输入至分组预测网络中，通过所述分组预测网络中的缓存模块将所述k个音频帧依次进行缓存，包括：

6.如权利要求2所述的音频处理方法，其特征在于，所述根据所述l个音频组帧数对所述缓存模块中的k个音频帧进行分组，得到l个音频特征组，包括：

7.如权利要求1所述的音频处理方法，其特征在于，所述根据所述l个音频特征组对应的l个音频组帧数，确定所述l个音频特征组对应的l个压缩次数，包括：

8.如权利要求7所述的音频处理方法，其特征在于，所述根据所述l个音频特征组对应的l个压缩次数对所述l个音频特征组进行压缩，得到l个压缩音频特征，包括：

9.如权利要求8所述的音频处理方法，其特征在于，所述根据所述l个压缩层组对所述l个音频特征组进行压缩，得到l个压缩音频特征，包括：

10.如权利要求9所述的音频处理方法，其特征在于，所述压缩网络层包括第二卷积层、第一激励层、第二激励层及第三卷积层，其中...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人