【技术实现步骤摘要】
【国外来华专利技术】
本申请整体涉及音频译码(例如,音频编码和/或解码)。例如,描述了用于至少部分地通过组合由机器学习系统(例如,基于神经网络的模型)生成的线性时变滤波器与线性预测译码(lpc)滤波器来执行音频译码的系统和技术。
技术介绍
1、音频译码(也称为语音译码和/或话音译码)是用于使用尽可能少的位来表示数字化音频信号(从而压缩话音数据),同时试图维持特定水平的音频质量的技术。音频或语音编码器用于将数字化音频(例如,话音、音乐等)信号编码(或压缩)为较低位率的数据流。可将较低位率的数据流输入到音频或语音解码器,该音频或语音解码器对数据流进行解码并且构造原始信号的近似或重构。音频或语音编码器-解码器结构可被称为音频译码器(或语音译码器或话音译码器)或音频/语音/话音译码器-解码器(编解码器)。
2、音频译码器利用话音信号是高度相关波形的事实。一些话音译码技术基于话音产生的来源-滤波器模型,其假设声带是频谱平坦声音(激励信号)的来源,并且声道充当滤波器以对各种话音声音进行频谱整形。不同音素(例如,元音、摩擦音和语音摩擦音)可通过其激励(来源)和
...【技术保护点】
1.一种用于音频译码的装置,所述装置包括:
2.根据权利要求1所述的装置,其中所述音频信号是话音信号,并且其中所述输出音频信号是作为所述话音信号的重建变体的重建话音信号。
3.根据权利要求1或2中任一项所述的装置,其中为了接收所述一个或多个特征,所述一个或多个处理器被配置为从以下中的至少一者接收所述一个或多个特征:
4.根据权利要求1至3中任一项所述的装置,其中所述激励信号是以下中的一者:
5.根据权利要求1至4中任一项所述的装置,其中所述ML滤波器估计器包括以下中的一者:
6.根据权利要求1至5中任一项所述
...【技术特征摘要】
【国外来华专利技术】
1.一种用于音频译码的装置,所述装置包括:
2.根据权利要求1所述的装置,其中所述音频信号是话音信号,并且其中所述输出音频信号是作为所述话音信号的重建变体的重建话音信号。
3.根据权利要求1或2中任一项所述的装置,其中为了接收所述一个或多个特征,所述一个或多个处理器被配置为从以下中的至少一者接收所述一个或多个特征:
4.根据权利要求1至3中任一项所述的装置,其中所述激励信号是以下中的一者:
5.根据权利要求1至4中任一项所述的装置,其中所述ml滤波器估计器包括以下中的一者:
6.根据权利要求1至5中任一项所述的装置,其中所述发声估计器包括以下中的一者:
7.根据权利要求1至6中任一项所述的装置,其中为了生成所述输出音频信号,所述一个或多个处理器被配置为使用合成滤波器组来组合所述多个频带特定信号。
8.根据权利要求1至7中任一项所述的装置,其中为了生成所述输出音频信号,所述一个或多个处理器被配置为通过根据所述一个或多个参数将所述一个或多个线性滤波器中的至少一者应用于所述多个频带特定信号中的每一者来修改所述多个频带特定信号。
9.根据权利要求8所述的装置,其中为了生成所述输出音频信号,所述一个或多个处理器被配置为:
10.根据权利要求1至9中任一项所述的装置,其中为了生成所述输出音频信号,所述一个或多个处理器被配置为通过根据所述一个或多个增益值将所述一个或多个增益放大器中的至少一者应用于所述多个频带特定信号中的每一者来修改所述多个频带特定信号。
11.根据权利要求10所述的装置,其中为了生成所述输出音频信号,所述一个或多个处理器被配置为:
12.根据权利要求1至11中任一项所述的装置,其中所述一个或多个处理器被配置为:
13.根据权利要求1至12中任一项所述的装置,其中所述一个或多个处理器被配置为:
14.根据权利要求1至13中任一项所述的装置,其中所述一个或多个特征包括一个或多个对数梅尔频率频谱特征。
15.根据权利要求1至14中任一项所述的装置,...
【专利技术属性】
技术研发人员:Z·I·斯科迪利斯,V·拉金德兰,D·德瓦苏伦德拉,G·K·索蒂埃雷,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。