用于多频带音频译码的系统和方法技术方案

技术编号：41711783 阅读：14 留言：0更新日期：2024-06-19 12:40

描述了用于音频译码的系统和技术。音频系统例如从编码器和/或话音合成引擎接收对应于音频信号的特征。该音频系统基于该特征生成激励信号，诸如谐波信号和/或噪声信号。该音频系统使用滤波器组从该激励信号生成频带特定信号。该频带特定信号对应于频带。该音频系统将该特征输入到机器学习(ML)滤波器估计器中以生成与线性滤波器相关联的参数。该音频系统将该特征输入到发声估计器中以生成增益值。该音频系统基于该频带特定信号的修改、根据该参数的该线性滤波器的应用和根据该增益值使用该增益放大器的放大来生成输出音频信号。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本申请整体涉及音频译码(例如，音频编码和/或解码)。例如，描述了用于至少部分地通过组合由机器学习系统(例如，基于神经网络的模型)生成的线性时变滤波器与线性预测译码(lpc)滤波器来执行音频译码的系统和技术。

技术介绍

1、音频译码(也称为语音译码和/或话音译码)是用于使用尽可能少的位来表示数字化音频信号(从而压缩话音数据)，同时试图维持特定水平的音频质量的技术。音频或语音编码器用于将数字化音频(例如，话音、音乐等)信号编码(或压缩)为较低位率的数据流。可将较低位率的数据流输入到音频或语音解码器，该音频或语音解码器对数据流进行解码并且构造原始信号的近似或重构。音频或语音编码器-解码器结构可被称为音频译码器(或语音译码器或话音译码器)或音频/语音/话音译码器-解码器(编解码器)。

2、音频译码器利用话音信号是高度相关波形的事实。一些话音译码技术基于话音产生的来源-滤波器模型，其假设声带是频谱平坦声音(激励信号)的来源，并且声道充当滤波器以对各种话音声音进行频谱整形。不同音素(例如，元音、摩擦音和语音摩擦音)可通过其激励(来源)和...

【技术保护点】

1.一种用于音频译码的装置，所述装置包括：

2.根据权利要求1所述的装置，其中所述音频信号是话音信号，并且其中所述输出音频信号是作为所述话音信号的重建变体的重建话音信号。

3.根据权利要求1或2中任一项所述的装置，其中为了接收所述一个或多个特征，所述一个或多个处理器被配置为从以下中的至少一者接收所述一个或多个特征：

4.根据权利要求1至3中任一项所述的装置，其中所述激励信号是以下中的一者：

5.根据权利要求1至4中任一项所述的装置，其中所述ML滤波器估计器包括以下中的一者：

6.根据权利要求1至5中任一项所述的装置，其中所述发声...

【技术特征摘要】
【国外来华专利技术】

1.一种用于音频译码的装置，所述装置包括：

2.根据权利要求1所述的装置，其中所述音频信号是话音信号，并且其中所述输出音频信号是作为所述话音信号的重建变体的重建话音信号。

4.根据权利要求1至3中任一项所述的装置，其中所述激励信号是以下中的一者：

5.根据权利要求1至4中任一项所述的装置，其中所述ml滤波器估计器包括以下中的一者：

6.根据权利要求1至5中任一项所述的装置，其中所述发声估计器包括以下中的一者：

7.根据权利要求1至6中任一项所述的装置，其中为了生成所述输出音频信号，所述一个或多个处理器被配置为使用合成滤波器组来组合所述多个频带特定信号。

8.根据权利要求1至7中任一项所述的装置，其中为了生成所述输出音频信号，所述一个或多个处理器被配置为通过根据所述一个或多个参数将所述一个或多个线性滤波器中的至少一者应用于所述多个频带特定信号中的每一者来修改所述多个频带特定信号。

9.根据权利要求8所述的装置，其中为了生成所述输出音频信号，所述一个或多个处理器被配置为：

10.根据权利要求1至9中任一项所述的装置，其中为了生成所述输出音频信号，所述一个或多个处理器被配置为通过根据所述一个或多个增益值将所述一个或多个增益放大器中的至少一者应用于所述多个频带特定信号中的每一者来修改所述多个频带特定信号。

11.根据权利要求10所述的装置，其中为了生成所述输出音频信号，所述一个或多个处理器被配置为：

12.根据权利要求1至11中任一项所述的装置，其中所述一个或多个处理器被配置为：

13.根据权利要求1至12中任一项所述的装置，其中所述一个或多个处理器被配置为：

14.根据权利要求1至13中任一项所述的装置，其中所述一个或多个特征包括一个或多个对数梅尔频率频谱特征。

15.根据权利要求1至14中任一项所述的装置，...

【专利技术属性】
技术研发人员：Z·I·斯科迪利斯，V·拉金德兰，D·德瓦苏伦德拉，G·K·索蒂埃雷，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人