编码装置、解码装置、它们的方法、程序以及记录介质制造方法及图纸

技术编号:16287552 阅读:52 留言:0更新日期:2017-09-26 01:45
根据编码装置,在频域中对每预定时间区间的时序信号进行编码,其中,将参数η设为正数,将与时序信号对应的参数η作为对白化频谱序列的直方图进行近似的广义高斯分布的形状参数,按每预定时间区间能够选择多个参数η中的任一个或者参数η可变,上述白化频谱序列是将频域样本串除以通过将与该时序信号对应的频域样本串的绝对值的η次方当作功率谱而估计出的频谱包络频谱包络所得的序列,所述编码装置包括:编码部,通过至少基于每预定时间区间的参数η而确定的结构的编码处理,对每预定时间区间的时序信号进行编码。

Encoding device, decoding device, method thereof, program, and recording medium

According to the encoding device in the frequency domain signal for each predetermined time interval of encoding, the parameter will be set to a positive parameter parameter corresponding to the timing signal for spectrum histogram sequence albino approximation of the generalized Gauss distribution shape, according to each predetermined time interval to select more than one parameter. Any parameter or variable, the sequence is the sequence spectrum whitening spectral envelope spectrum envelope on the frequency domain samples divided by the frequency domain samples corresponding to the timing signal on the absolute value of the power spectrum and ETA square as estimated, the encoding device includes: encoding, through at least based on parameters each predetermined time interval is determined by the structure of the encoding process, the timing signal for each predetermined time interval of encoding.

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对声音信号等时序信号进行编码或者解码的技术。
技术介绍
作为表示声音信号等时序信号的特征的参数,已知LSP等参数(例如,参照非专利文献1)。由于LSP包含多个值,所以有时难以直接使用于声音的分类或区间估计。例如,由于LSP包含多个值,所以使用了LSP的基于阈值的处理不能说是简单。另外,虽然没有成为公知,但由专利技术人提出了参数η。该参数η是在对利用例如3GPPEVS(增强语音服务(EnhancedVoiceServices))标准中使用的线性预测包络的频域的系数的量化值进行算术编码的编码方式中,确定算术码的编码对象所属的概率分布的形状参数。参数η与编码对象的分布具有关联性,若适当地确定参数η则能够进行效率高的编码以及解码。此外,参数η可成为表示时序信号的特征的指标。因此,虽然没有成为公知,但考虑基于参数η而确定适当的编码处理或者解码处理的结构,进行所确定的结构的编码处理或者解码处理。【现有技术文献】【非专利文献】【非专利文献1】守谷健弘,“高圧縮音声符号化の必須技術:線スペクトル対(LSP)”,NTT技術ジャーナル,2014年9月,P.58-60专
技术实现思路
专利技术要本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201680007279.html" title="编码装置、解码装置、它们的方法、程序以及记录介质原文来自X技术">编码装置、解码装置、它们的方法、程序以及记录介质</a>

【技术保护点】
一种编码装置,在频域中对每预定时间区间的时序信号进行编码,其中,将参数η设为正数,将与时序信号对应的参数η作为对白化频谱序列的直方图进行近似的广义高斯分布的形状参数,按上述每预定时间区间能够选择多个参数η中的任一个或者参数η可变,上述白化频谱序列是将上述频域样本串除以通过将与该时序信号对应的频域样本串的绝对值的η次方当作功率谱而估计出的频谱包络频谱包络所得的序列,所述编码装置包括:编码部,通过至少基于上述每预定时间区间的参数η而确定的结构的编码处理,对上述每预定时间区间的时序信号进行编码。

【技术特征摘要】
【国外来华专利技术】2015.01.30 JP 2015-017691;2015.04.13 JP 2015-081771.一种编码装置,在频域中对每预定时间区间的时序信号进行编码,其中,将参数η设为正数,将与时序信号对应的参数η作为对白化频谱序列的直方图进行近似的广义高斯分布的形状参数,按上述每预定时间区间能够选择多个参数η中的任一个或者参数η可变,上述白化频谱序列是将上述频域样本串除以通过将与该时序信号对应的频域样本串的绝对值的η次方当作功率谱而估计出的频谱包络频谱包络所得的序列,所述编码装置包括:编码部,通过至少基于上述每预定时间区间的参数η而确定的结构的编码处理,对上述每预定时间区间的时序信号进行编码。2.如权利要求1所述的编码装置,其中,上述编码部按上述每预定时间区间,通过基于通过将与上述时序信号对应的频域样本串的绝对值的η次方当作功率谱的频谱包络的估计而估计出的频谱包络的值来改变比特分配或者比特分配实质上发生改变的编码处理,对与上述时序信号对应的频域样本串进行编码而得到码并输出,输出表示与上述输出的码对应的参数η的参数码。3.如权利要求2所述的编码装置,其中,还包括:参数决定部,按上述每预定时间区间决定参数η,上述编码部通过使用上述决定的参数η进行上述编码处理而得到码并输出。4.如权利要求2所述的编码装置,其中,上述编码部使用上述多个参数η的每一个,对与相同的预定时间区间的时序信号对应的频域样本串进行上述编码处理而得到多个码,基于得到的码的码量以及与得到的码对应的编码失真中的至少一方,选择上述多个码中的任一个码并输出。5.如权利要求2所述的编码装置,其中,上述编码部得到通过上述编码处理而得到的码的估计码量,上述编码处理是使用上述多个参数η的每一个,对与相同的预定时间区间的时序信号对应的频域样本串进行的处理,基于上述得到的估计码量,选择上述多个参数η中的任一个,使用上述选择的参数η进行上述编码处理而得到码并输出。6.如权利要求2至5的任一项所述的编码装置,其中,还包括:分割部,将上述频域样本串分割为由与上述频域样本串的周期性分量对应的样本构成的第一频域样本串、和由与上述频域样本串的周期性分量对应的样本以外的样本构成的第二频域样本串,并将表示与上述周期性分量对应的样本的信息作为辅助信息来输出,上述编码装置针对第一频域样本串以及第二频域样本串的每一个进行上述编码处理。7.如权利要求1所述的编码装置,其中,还包括:参数决定部,决定与输入的时序信号对应的参数η;以及确定部,至少基于上述决定的参数η而确定编码处理的结构,生成能够确定上述编码处理的结构的确定码并输出,上述编码部通过上述确定的结构的编码处理,对上述输入的时序信号进行编码。8.如权利要求7所述的编码装置,其中,上述确定部不仅基于上述决定的参数η,还基于表示上述输入的时序信号的声音的大小的指标、表示声音的大小的指标的时间性变动、频谱形状、频谱形状的时间性变动、基音的周期性的程度中的至少一个,确定编码处理的结构。9.如权利要求8所述的编码装置,其中,能够确定上述编码处理的结构的确定码是表示与上述输入的时序信号对应的参数η的参数码。10.一种编码装置,在频域中对每预定时间区间的时序信号进行编码,其中,将参数η设为正数,按上述每预定时间区间能够选择多个参数η中的任一个或者参数η可变,所述编码装置包括:编码部,按上述每预定时间区间,通过基于通过将与上述时序信号对应的频域样本串的绝对值的η次方当作功率谱的频谱包络的估计而估计出的频谱包络的值来改变比特分配或者比特分配实质上发生改变的编码处理,对与上述时序信号对应的频域样本串进行编码而得到码并输出,输出表示与上述输出的码对应的参数η的参数码。11.一种解码装置,其中,将参数η设为正数,将表示参数η的参数码作为表示对白化频谱序列的直方图进行近似的广义高斯分布的形状参数的码,上述白化频谱序列是将上述频域样本串除以通过将与该参数η对应的频域样本串的绝对值的η次方当作功率谱而估计出的频谱包络频谱包络所得的序列,所述解码装置包括:参数码解码部,对输入的参数码进行解码而得到参数η;确定部,至少基于上述得到的参数η而确定解码处理的结构;以及解码部,通过上述确定的结构的解码处理而进行所输入的码的解码。12.如权利要求11所述的解码装置,其中,上述解码装置是通过频域中的解码而得到与时序信号对应的频域样本串的解码装置,所述解码装置还包括:线性预测系数解码部,通过对输入的线性预测系数码进行解码,从而得到能够转换为线性预测系数的系数;以及非平滑化频谱包络序列生成部,使用上述得到的参数η,得到非平滑化频谱包络序列,该非平滑化频谱包络序列是将与能够转换为上述线性预测系数的系数对应的振幅频谱包络的序列进行了1/η次方的序列,上述解码部根据基于上述非平滑化频谱包络序列而发生改变的比特分配或者实质上发生改变的比特分配,进行所输入的整数信号码的解码,从而得到与上述时序信号对应的频域样本串。13.如权利要求11所述的解码装置,其中,还包括:音...

【专利技术属性】
技术研发人员:守谷健弘镰本优原田登川西隆仁龟冈弘和杉浦亮介
申请(专利权)人:日本电信电话株式会社国立大学法人东京大学
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1