声音编码装置以及声音编码方法制造方法及图纸

技术编号:17409630 阅读:51 留言:0更新日期:2018-03-07 06:36
本发明专利技术涉及声音编码装置以及声音编码方法。一种声音编码装置,其对所输入的声音信号进行编码而输出编码序列,该声音编码装置具有:编码部,其对所述声音信号进行编码而获得包含所述声音信号的编码序列;时间包络信息取得部,其取得与所述声音信号的时间包络相关的信息;以及复用部,其对由所述编码部获得的编码序列和由所述时间包络信息取得部获得的与时间包络相关的信息进行复用,使用对所输入的声音信号的变换系数进行线性预测分析而得到的结果,生成所述与时间包络相关的信息。

Sound coding device and sound coding method

The invention relates to a sound encoding device and a sound coding method. A voice encoding device, the encoding of the sound signal input and output encoding sequence, the voice encoding device includes: encoding, the encoding of the sound signal and the sound signal encoding sequence; time envelope information acquisition unit, the information obtained and the sound signal of the time envelope correlation; and the multiplexing, encoding sequences obtained by the encoding part and a related time envelope information by the time envelope information are multiplexed using the sound signal of the input change coefficient of linear prediction analysis and get the results, and the generation of the time envelope correlation information.

【技术实现步骤摘要】
声音编码装置以及声音编码方法本申请是申请日为2015年3月20日,国家申请号为201580015128.8(国际申请号为PCT/JP2015/058608),专利技术名称为“声音解码装置、声音编码装置、声音解码方法、声音编码方法、声音解码程序以及声音编码程序”的专利技术专利申请的分案申请。
本专利技术涉及声音解码装置、声音编码装置、声音解码方法、声音编码方法、声音解码程序以及声音编码程序。
技术介绍
将声音信号、音响信号的数据量压缩成几十分之一的声音编码技术是在信号的传送/储存中极其重要的技术。作为广泛利用的声音编码技术的例子,能够举出在频域中对信号进行编码的变换编码方式。在变换编码中,为了以低比特率来获得高质量,广泛使用根据输入信号按照每个频带分配编码所需要的比特的自适应比特分配。使编码所造成的失真最小化的比特分配方法是与各频带的信号功率相应的分配,也进行在该分配的基础上考虑了人类的听觉的形式的比特分配。另一方面,有一种用于改善分配比特数非常少的频带的质量的技术。在专利文献1中公开了如下方法:对所分配的比特数比规定的阈值少的频带的变换系数利用其他频带的变换系数来进行近似化。另外,在专利文献2中公开了如下方法:针对在频带内因为功率较小而量化成零的分量生成伪噪声信号;复制其他频带的未量化成零的分量的信号。此外,对于声音信号、音响信号来说,一般与高频带相比功率偏集中于低频带,考虑到对主观质量带来的影响也大的情况,也广泛使用频带扩展技术,在该频带扩展技术中使用编码后的低频带来生成输入信号的高频带。在频带扩展技术中,能够利用少量的比特数来生成高频带,因此能够以低比特率来获得高质量。在专利文献3中公开了如下方法:将低频带的频谱复制到高频带后,基于从编码器发送的与高频带频谱的性质相关的信息,调整频谱形状来生成高频带。现有技术文献专利文献专利文献1:日本特开平9-153811号公报专利文献2:美国特许第7447631号说明书专利文献3:日本特许第5203077号公报
技术实现思路
专利技术要解决的课题在上述技术中,利用少量的比特数来编码后的频带的分量生成为在频域中与基音的该分量相似。另一方面,有时在时域中失真明显而质量劣化。鉴于上述问题,本专利技术的目的在于提供一种减轻利用少量的比特数来编码后的频带的分量在时域中的失真而能够改善质量的声音解码装置、声音编码装置、声音解码方法、声音编码方法、声音解码程序以及声音编码程序。用于解决课题的手段为了解决上述课题,本专利技术的一个方面的声音解码装置对编码后的声音信号进行解码而输出声音信号,该声音解码装置具有:解码部,其对包含所述编码后的声音信号的编码序列进行解码而获得解码信号;以及选择性时间包络整形部,其基于与所述编码序列的解码相关的解码相关信息,对解码信号中的频带的时间包络进行整形。信号的时间包络表示信号的能量或功率(以及与它们等价的参数)对时间方向的变动。根据本结构,能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。另外,本专利技术的另一个方面的声音解码装置对编码后的声音信号进行解码而输出声音信号,该声音解码装置具有:逆复用部,其分离包含所述编码后的声音信号的编码序列和与该声音信号的时间包络相关的时间包络信息;解码部,其对所述编码序列进行解码而获得解码信号;以及选择性时间包络整形部,其基于所述时间包络信息和与所述编码序列的解码相关的解码相关信息中的至少一个,对解码信号中的频带的时间包络进行整形。根据本结构,基于在生成输出所述声音信号的编码序列的声音编码装置中参照输入到该声音编码装置的声音信号而生成的时间包络信息,能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,解码部具有:解码/逆量化部,其对所述编码序列进行解码或者/以及逆量化而获得频域的解码信号;解码相关信息输出部,其输出所述解码/逆量化部在解码或者/以及逆量化的过程中获得的信息和对所述编码序列进行解析而获得的信息中的至少一个作为解码相关信息;以及时间频率逆变换部,其将所述频域的解码信号变换成时域的信号而输出。根据本结构,能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。另外,也可以为,解码部具有:编码序列解析部,其将所述编码序列分离成第1编码序列和第2编码序列;第1解码部,其对所述第1编码序列进行解码或者/以及逆量化而获得第1解码信号,且获得第1解码相关信息作为所述解码相关信息;以及第2解码部,其使用所述第2编码序列和第1解码信号中的至少一个来获得第2解码信号而输出,且输出第2解码相关信息作为所述解码相关信息。根据本结构,即使由多个解码部进行解码而生成解码信号时,也能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,第1解码部具有:第1解码/逆量化部,其对所述第1编码序列进行解码或者/以及逆量化而获得第1解码信号;以及第1解码相关信息输出部,其输出所述第1解码/逆量化部在解码或者/以及逆量化的过程中获得的信息和对所述第1编码序列进行解析而获得的信息中的至少一个作为第1解码相关信息。根据本结构,当由多个解码部进行解码而生成解码信号时,至少基于与第1解码部相关的信息,能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,第2解码部具有:第2解码/逆量化部,其使用所述第2编码序列和所述第1解码信号中的至少一个来获得第2解码信号;以及第2解码相关信息输出部,其输出所述第2解码/逆量化部在获得第2解码信号的过程中获得的信息和对所述第2编码序列进行解析而获得的信息中的至少一个作为第2解码相关信息。根据本结构,当由多个解码部进行解码而生成解码信号时,至少基于与第2解码部相关的信息,能够将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,选择性时间包络整形部具有:时间/频率变换部,其将所述解码信号变换成频域的信号;频率选择性时间包络整形部,其基于所述解码相关信息,对所述频域的解码信号进行各频带的时间包络的整形;以及时间/频率逆变换部,其将对所述各频带的时间包络进行了整形后的频域的解码信号变换成时域的信号。根据本结构,能够在频域中将利用少量的比特数来编码后的频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,解码相关信息是与各频带的编码比特数相关的信息。根据本结构,能够根据各频带的编码比特数将该频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,解码相关信息是与各频带的量化步长相关的信息。根据本结构,能够根据各频带的量化步长将该频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,解码相关信息是与各频带的编码方式相关的信息。根据本结构,能够根据各频带的编码方式将该频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,解码相关信息是与注入到各频带的噪声分量相关的信息。根据本结构,能够根据注入到各频带的噪声分量将该频带的解码信号的时间包络整形成期望的时间包络而改善质量。也可以为,频率选择性时间包络整形部使用滤波器将与对时间包络进行整形的频带对应的所述解码本文档来自技高网
...
声音编码装置以及声音编码方法

【技术保护点】
一种声音编码装置,其对所输入的声音信号进行编码而输出编码序列,该声音编码装置具有:编码部,其对所述声音信号进行编码而获得包含所述声音信号的编码序列;时间包络信息取得部,其取得与所述声音信号的时间包络相关的信息;以及复用部,其对由所述编码部获得的编码序列和由所述时间包络信息取得部获得的与时间包络相关的信息进行复用,使用对所输入的声音信号的变换系数进行线性预测分析而得到的结果,生成所述与时间包络相关的信息。

【技术特征摘要】
2014.03.24 JP 2014-0606501.一种声音编码装置,其对所输入的声音信号进行编码而输出编码序列,该声音编码装置具有:编码部,其对所述声音信号进行编码而获得包含所述声音信号的编码序列;时间包络信息取得部,其取得与所述声音信号的时间包络相关的信息;以及复用部,其对由所述编码部获得的编码序列和由所述时间包络信息取得部获得的与时间包络相关的信息进行复用,使用对所输入的声音信号的变换系数进行线性预测分析而得到的结果,生成所述与时间包络相关的信息。2.根据权利要求1所述的声音编码装置,其中,基于通过所述线性预测分析而计算出的预测增益,生成所述与时间包络相关的信息。3.根据权利要求2所述的声音编码装置,其中,当计算所述预测...

【专利技术属性】
技术研发人员:菊入圭山口贵史
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1