【技术实现步骤摘要】
【国外来华专利技术】语音编码器中的相位量化
技术介绍
随着数字无线电话网络、互联网上语音流式传输和互联网电话的出现,语音的数字处理已变得司空见惯。工程师使用压缩来高效处理语音,同时仍保持质量。语音压缩的一个目标是以一种针对给定数量的比特提供最大信号质量的方式表示语音信号。换句话说,该目标是,对于给定的质量水平,用最少的比特表示语音信号。在一些场景中,还可以应用其他目标,例如对传输错误的弹性以及限制由于编码/传输/解码导致的整体延迟。一种类型的常规语音编码器/解码器(“编解码器”)使用线性预测(“LP”)来实现压缩。语音编码器针对预测滤波器找到并量化LP系数,所述LP系数用于将样本值预测为先前样本值的线性组合。残差信号(也称为“激励”信号)指示原始信号的未通过滤波准确预测的部分。由于不同种类的语音具有不同的特性,因此语音编码器通常对浊音段(通过声带振动表征)、清音段和无声段使用不同的压缩技术来压缩残差信号。对应的语音解码器重构残差信号,恢复在合成滤波器中使用的LP系数,并用合成滤波器处理残差信号。考虑到压缩对在计算机系统中表示语音的重要性,语音压缩吸引了大量的 ...
【技术保护点】
1.一种在实现语音编码器的计算机系统中的方法,包括:/n接收语音输入;/n对所述语音输入进行编码以产生编码数据,包括:/n根据线性预测系数,基于所述语音输入对输入值进行滤波,从而产生残差值;以及/n对所述残差值进行编码,包括:/n确定相位值集合;以及/n对所述相位值集合进行编码,包括使用基函数的加权和以及线性分量来表示所述相位值集合中的至少一些相位值;以及/n存储所述编码数据以作为比特流的一部分输出。/n
【技术特征摘要】
【国外来华专利技术】20181217 US 16/222,7991.一种在实现语音编码器的计算机系统中的方法,包括:
接收语音输入;
对所述语音输入进行编码以产生编码数据,包括:
根据线性预测系数,基于所述语音输入对输入值进行滤波,从而产生残差值;以及
对所述残差值进行编码,包括:
确定相位值集合;以及
对所述相位值集合进行编码,包括使用基函数的加权和以及线性分量来表示所述相位值集合中的至少一些相位值;以及
存储所述编码数据以作为比特流的一部分输出。
2.根据权利要求1所述的方法,其中,确定所述相位值集合包括:
对当前帧的一个或多个子帧应用频率变换,从而产生相应子帧的复幅度值;
聚合所述相应子帧的所述复幅度值;以及
至少部分地基于所聚合的复幅度值来计算所述相位值集合。
3.根据权利要求1所述的方法,其中,对所述相位值集合进行编码还包括:省略具有高于截止频率的频率的所述相位值集合中的任何相位值。
4.根据权利要求1所述的方法,其中,所述基函数是正弦函数。
5.根据权利要求1所述的方法,其中,对所述相位值集合进行编码还包括:
确定对所述基函数加权的系数集合;
确定对所述线性分量参数化的偏移值和斜率值;以及
对所述系数集合、所述偏移值和所述斜率值进行熵编码。
6.根据权利要求1所述的方法,其中,对所述相位值集合进行编码还包括:使用延迟决策方法来确定对所述基函数加权的系数集合,并且其中,所述延迟决策方法包括,对于多个阶段中的每个给定阶段,迭代地进行以下操作:
评估所述系数之中的根据成本函数与所述给定阶段相关联的给定系数的多个候选值,其中,如果存在前一阶段,则所述多个候选值中的每个候选值与来自所述前一阶段的候选解决方案集合中的每个候选解决方案相组合地进行评估;以及
至少部分基于根据所述成本函数的评分,保留所评估的组合的计数,作为来自所述给定阶段的候选解决方案集合。
7.根据权利要求1所述的方法,其中,对所述相位值集合进行编码还包括,使用成本函数来确定对所述基函数加权的候选系数集合的分数,包括:
通过根据所述候选系数集合对所述基函数加权,来重构所述相位值集合的一个版本;以及
在将所述相位值集合的重构版本的倒数应用于复幅度值时,计算线性相位度量。
8.根据权利要求1所述的方法,其中,对所述相位值集合进行编码还包括:至少部分地基于所述编码数据的目标比特率,设置对所述基函数加权的系数的计数。
9.一种或多种计算机可读介质,其上存储有计算机可执行指令,所述计算机可执行指令在由一个或多个处理器编程时,用于使所述一个或多个处理器执行语音编码器的操作,所述操作包括:
接收语音输入;
对所述语音输入进行编码以产生编码数据,包括:
根据线性预测系数,基于所述语音输入对输入值进行滤波,从而产生残差值;
对所述残差值进行编码,包括:
确定相位值集合;以及
对所述相位值集合进行编码...
【专利技术属性】
技术研发人员:S·S·詹森,S·斯里尼瓦桑,K·B·福斯,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。