参数决定装置、方法、程序及记录介质制造方法及图纸

技术编号:16708293 阅读:36 留言:0更新日期:2017-12-02 23:39
参数决定装置具备:频谱包络估计单元(42),将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元(43),得到将频域样本串除以频谱包络后的序列即白色化频谱序列;以及参数取得单元(44),求得以参数η为形状参数的一般化高斯分布近似白色化频谱序列的直方图的参数η。

【技术实现步骤摘要】
【国外来华专利技术】参数决定装置、方法、程序及记录介质
本专利技术涉及在音信号等时序信号的编码技术中,决定表示音信号等时序信号的特征的参数的技术。
技术介绍
作为表示音信号等时序信号的特征的参数,已知LSP等参数(例如,参照非专利文献1)。由于LSP为高次,因此直接使用于音的分类、区间估计则有时处理困难。例如,由于LSP为高次,所以基于使用了LSP的阈值的处理不能说容易。然而,虽然并非公知,但由专利技术人提出了参数η。该参数η是,例如在3GPPEVS(增强语音服务(EnhancedVoiceServices))标准中使用的对利用线性预测包络的频域的系数的量化值进行算术编码的编码方式中,决定算术码的编码对象所属的概率分布的形状参数。参数η与编码对象的分布具有关联性,若适当决定参数η,则能够进行效率高的编码及解码。此外,参数η能够成为表示时序信号的特征的指标。因此,参数η能够用于上述编码处理以外的技术、例如音的分类、音区间的估计等声音音响关联技术。进而,由于参数η为一次值,所以基于使用了参数η的阈值的处理与基于使用了LSP的阈值的处理相比更容易。因此,参数η能够容易地用于音的分类、区间估计。现有技术文献非专利文献非专利文献1:守谷健弘,“高圧縮音声符号化の必須技術:線スペクトル対(LSP)”,NTT技術ジャーナル,2014年9月,P.58-60
技术实现思路
专利技术要解决的课题决定参数η的技术此前没有被提出。本专利技术的目的在于,提供决定参数η的参数决定装置、方法、程序及记录介质。用于解决课题的手段根据本专利技术的一方式的参数决定装置,具备:频谱包络估计单元,将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元,得到将上述频域样本串除以频谱包络后的序列即白色化频谱序列;以及参数取得单元,求得以参数η为形状参数的一般化高斯分布近似上述白色化频谱序列的直方图的参数η。专利技术效果能够决定参数η。附图说明图1是用于说明参数决定装置的例子的框图。图2是用于说明参数决定方法的例子的流程图。图3是用于说明一般化高斯分布的图。图4是用于说明编码装置的例子的框图。图5是用于说明编码方法的例子的流程图。图6是用于说明编码单元的处理的例子的流程图。图7是用于说明编码单元的例子的框图。图8是用于说明编码单元的例子的框图。图9是用于说明本专利技术的解码装置的例子的框图。图10是用于说明解码方法的例子的流程图。图11是用于说明解码单元的处理的例子的流程图。图12是用于说明音分类装置的例子的框图。图13是用于说明音分类方法的例子的流程图。具体实施方式[参数决定装置及方法]在图1中示出参数决定装置的结构例。参数决定装置例如图1所示那样具备频域变换单元41、频谱包络估计单元42、白色化频谱序列生成单元43、参数取得单元44。频谱包络估计单元42例如具备线性预测分析单元421及非平滑化振幅频谱包络序列生成单元422。在图2中示出通过由例如该参数决定装置实现的参数决定方法的各处理的例子。以下,说明图1的各单元。<频域变换单元41>向频域变换单元41输入作为时序信号的时域的音信号。音信号的例子是声音数字信号或者音响数字信号。频域变换单元41以规定的时间长度的帧单位,将所输入的时域的音信号变换为频域的N点的MDCT系数串X(0),X(1),……,X(N-1)。N为正整数。所得到的MDCT系数串X(0),X(1),……,X(N-1)被输出至频谱包络估计单元42及白色化频谱序列生成单元43。只要没有特别提及,设为以后的处理以帧单位来进行。这样,频域变换单元41求得与音信号对应的、例如作为MDCT系数串的频域样本串(步骤C41)。<频谱包络估计单元42>向频谱包络估计单元42输入频域变换单元21得到的MDCT系数串X(0),X(1),……,X(N-1)。频谱包络估计单元42基于通过规定的方法决定的参数η0,进行将与时序信号对应的频域样本串的绝对值的η0次方作为功率谱使用的频谱包络的估计(步骤C42)。所估计出的频谱包络被输出至白色化频谱序列生成单元43。频谱包络估计单元42通过例如以下说明的线性预测分析单元421及非平滑化振幅频谱包络序列生成单元422的处理,生成非平滑化振幅频谱包络序列从而进行频谱包络的估计。设为参数η0通过规定的方法来决定。例如,将η0设为比0大的规定的数。例如,设为η0=1。此外,也可以使用在与想要求得当前参数η的帧相比更前的帧中求得的η。与想要求得当前参数η的帧(以下,设为当前帧。)相比更前的帧例如是当前帧的更前的帧并且是当前帧的附近的帧。当前帧的附近的帧例如是当前帧的前一帧。<线性预测分析单元421>向线性预测分析单元421输入频域变换单元41得到的MDCT系数串X(0),X(1),……,X(N-1)。线性预测分析单元421使用MDCT系数串X(0),X(1),……,X(N-1),对由以下的式(C1)定义的进行线性预测分析而生成线性预测系数β1,β2,……,βp,对所生成的线性预测系数β1,β2,……,βp进行编码而生成线性预测系数码和与线性预测系数码对应的量化后的线性预测系数即量化线性预测系数所生成的量化线性预测系数被输出至非平滑化频谱包络序列生成单元422。具体而言,线性预测分析单元421首先通过进行将MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η0次方视为功率谱的相当于傅里叶逆变换的运算、即式(C1)的运算,求得与MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η次方对应的时域的信号串即伪相关函数信号串然后,线性预测分析单元421使用所求得的伪相关函数信号串进行线性预测分析,生成线性预测系数β1,β2,……,βp。并且,线性预测分析单元421通过对所生成的线性预测系数β1,β2,……,βp进行编码,从而得到线性预测系数码、和与线性预测系数码对应的量化线性预测系数线性预测系数β1,β2,……,βp是与在将MDCT系数串X(0),X(1),……,X(N-1)的绝对值的η0次方视为功率谱时的时域的信号对应的线性预测系数。基于线性预测分析单元421的线性预测系数码的生成例如通过以往的编码技术来进行。以往的编码技术例如是,将与线性预测系数本身对应的码设为线性预测系数码的编码技术、将线性预测系数变换为LSP参数而将与LSP参数对应的码设为线性预测系数码的编码技术、将线性预测系数变换为PARCOR系数而将与PARCOR系数对应的码设为线性预测系数码的编码技术等。这样,线性预测分析单元421使用通过进行将例如MDCT系数串即频域样本串的绝对值的η次方视为功率谱的傅里叶逆变换而得到的伪相关函数信号串来进行线性预测分析,生成能够变换为线性预测系数的系数(步骤C421)。另外,在由参数决定装置生成的参数用于编码以外的情况下,线性预测分析单元421也可以不进行线性预测系数码的生成。<非平滑化振幅频谱包络序列生成单元422>向非平滑化振幅频谱包络序列生成单元422输入线性预测分析单元421生成的量化线性预测系数非平滑化振幅频谱包络序列生成单元422生成与量化线性预测系数对应的振幅频谱包络的序列即非平滑化振幅频谱包络序列所生成的非平滑化振幅本文档来自技高网...
参数决定装置、方法、程序及记录介质

【技术保护点】
一种参数决定装置,其中,包含:频谱包络估计单元,将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元,得到将上述频域样本串除以上述频谱包络后的序列即白色化频谱序列;以及参数取得单元,求得以参数η为形状参数的一般化高斯分布近似上述白色化频谱序列的直方图的参数η。

【技术特征摘要】
【国外来华专利技术】2015.01.30 JP 2015-0176901.一种参数决定装置,其中,包含:频谱包络估计单元,将参数η0及参数η设为正数,使用通过规定的方法而决定的参数η0,将与时序信号对应的频域样本串的绝对值的η0次方视为功率谱而进行频谱包络的估计;白色化频谱序列生成单元,得到将上述频域样本串除以上述频谱包络后的序列即白色化频谱序列;以及参数取得单元,求得以参数η为形状参数的一般化高斯分布近似上述白色化频谱序列的直方图的参数η。2.如权利要求1的参数决定装置,其中,进一步进行一次以上将由上述参数取得单元求得的参数η设为通过上述规定的方法而决定的参数η0的、上述频谱包络估计单元、上述白色化频谱序列生成单元及上述参数取得单元的处理。3.如权利要求1或者2的参数决定装置,其中,将q1、q2设为预先决定的不同的正整数,上述参数取得单元基于上述白色化频谱序列的q1次动差即mq1的值和上述白色化频谱序列的q2次动差即mq2的值来求得上述参数η。4.如权利要求3的参数决定装置,其中,将N设为规定的正数,设为k=0,1,……,N-1,将上述白色化频谱序列的各值设为XW(k),将Γ设为伽马函数,将F-1设为函数F的逆函数,上述参数取得单元求得的η由以下的式来定义,5.如权利要求4的参数决定装置,其中,上述参数取得单元基于上述白色化频谱序列而计算mq1/((mq2)q1/q2),参照预先准备的不同的多个与η对应的F(η)的对,取得与最接近于所计算出的mq1/((mq2)q1/q2)的F(η)对应的η。6.如权利要求4的参数决定装置,其中,将上述逆函数F-1的近似曲线函数设为上述参数取得单元基于上述白色化频谱序列来计算mq1/((mq2)q1/q2),并计算在对上述近似曲线函数输入了所计算出的mq1/((mq2)q1/q2)时的输出值,从而求得η。7.如权利要求1至6的任一项所述的参数决定装置,其中,上述参数决定装置按各帧的每一帧求得参数η,想要求得当前参数η的帧的通过上述规定的方法决定的参数η0是在与想要求得当前参数η的帧相比更前的帧中求得的η。8.如权利要求1至7的任一项所述的参数决定装置,其中,上述时序信号为音信号,上述参数η为表示上述音信号的特征的参数。9.一种参数决定方法,其中,包含:频谱包络估计步骤,将参数η0及参数η...

【专利技术属性】
技术研发人员:守谷健弘镰本优原田登龟冈弘和杉浦亮介
申请(专利权)人:日本电信电话株式会社国立大学法人东京大学
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1