【技术实现步骤摘要】
本专利技术涉及移动通信领域的语音编码技术,具体来说,涉及。
技术介绍
随着信息社会和通信技术的高速发展,语音编码逐渐成为人们生活中一项必不可少的技术。语音编码即压缩语音信号的数字表示而使表达这些信号所需的比特需求最小。语音编码目前主要分为三类,即波形编码、参数编码和混合编码。波形编码具有适应能力强、话音质量高等优点,但所需要的比特率较高。而参数编码的比特率一般很低,但是其编码质量较差,合成出的语音自然度较低。混合编码克服了波形编码和参数编码的弱点,同时又结合了它们各自的长处,在4-16kb/s速率上可以得到高质量的合成语音。代数码激励线性预测(ACELP)语音编码作为一种非常成功的混合语音编码方法,在ITU的许多语音编码标准中得到了应用,如G.722.2、G.723.1、G.729等。现有技术中,采用矢量量化码书的建立方法有很多。在大多数ACELP类语音编码中,自适应码书和固定码书的增益均采用矢量量化的方法,但并没有一种具有一般意义的增益码书的建立方法。在矢量量化技术中,若要得到较好的量化效果,就要充分利用量化对象的各种性质,只有这样才能得到高质量的矢量码书。因此,对于不同的量化对象,其矢量码书的建立方法中的关键技术是完全不同的。在ACELP语音编码中,自适应码书增益和固定码书增益是两个重要的量化对象,人们通常根据相邻帧固定码书增益之间的相关性,采用预测矢量量化方法来量化码书增益,以达到降低比特数的目的。但由于不同速率的ACELP语音编码器的激励帧长度不同,导致相邻帧间码书增益不同,相邻帧间码书增益的关联性不强,致使很难建立一种具有一般意义的增益码书方 ...
【技术保护点】
一种建立增益码书的方法,该方法应用于语音编码系统中,并对训练集中的数字语音信号进行预处理后生成随机激励信号,所述的每个随机激励信号由多个激励子帧组成,其特征在于,包括如下步骤:A、预编码训练集中的数字语音信号,生成包含有对数能量矢量的训练矢量序列并以数据文件的形式保存,所述每一个激励子帧对应有一所述的训练矢量序列;B、从所述数据文件中取出所述每一个子帧的训练矢量序列中的对数能量矢量,根据所述对数能量矢量求出所述随机激励信号的平均对数能量及所述平均对数能量的预测系数;C、根据所述训练矢量序列、平均对数能量及其预测系数计算感知加权平方误差,并迭代查找最小的感知加权平方误差来确定增益码书。
【技术特征摘要】
1.一种建立增益码书的方法,该方法应用于语音编码系统中,并对训练集中的数字语音信号进行预处理后生成随机激励信号,所述的每个随机激励信号由多个激励子帧组成,其特征在于,包括如下步骤A、预编码训练集中的数字语音信号,生成包含有对数能量矢量的训练矢量序列并以数据文件的形式保存,所述每一个激励子帧对应有一所述的训练矢量序列;B、从所述数据文件中取出所述每一个子帧的训练矢量序列中的对数能量矢量,根据所述对数能量矢量求出所述随机激励信号的平均对数能量及所述平均对数能量的预测系数;C、根据所述训练矢量序列、平均对数能量及其预测系数计算感知加权平方误差,并迭代查找最小的感知加权平方误差来确定增益码书。2.根据权利要求1所述一种建立增益码书的方法,其特征在于所述训练矢量序列除了所述随机激励信号的对数能量E,还包括每一激励子帧的自适应码书增益ga、固定码书增益gs、随机代数码矢量的能量Ea、目标矢量的能量Rx0x0、自适应码矢量经过感觉加权合成滤波器零状态响应的能量Rxx、随机码矢量经过感觉加权合成滤波器零状态响应的能量Rtt、目标矢量与自适应码矢量经过感觉加权合成滤波器零状态响应的内积Rx0x、目标矢量与随机码矢量经过感觉加权合成滤波器零状态响应的内积Rx0t和随机码矢量与自适应码矢量分别经过感觉加权合成滤波器零状态响应的内积Rxt,所述训练矢量序列构成了增益码书训练集合中的一个10维矢量,所述矢量按顺序保存于在一个二进制文件中。3.根据权利要求2所述一种建立增益码书的方法,其特征在于所述步骤B具体包括以下步骤B1,从存储的数据文件中提取所述训练矢量序列中的每一子帧的随机激励信号的对数能量E,并求出它们的平均值E;B2,取出每一子帧的随机激励信号的对数能量E,将所述对数能量减去所述平均值E,获得所述对应子帧的随机激励信号的无偏对数能量 B3、利用所述无偏对数能量 得到随机激励信号无偏对数能量 的线性预测系数。4.根据权利要求3所述的一种建立增益码书的方法,其特征在于所述步骤C具体包括C1、设置停止门限ε和码书NB,初始化质心并获取当前码书;C2、将当前码书的体积与设置码书NB进行比较,若当前码书的体积大于等于设置码书则转到步骤C3执行,否则转到步骤C5;C3、获取当前码书的最佳划分,提取最佳划分中的当前状态下的第k次迭代累计失真DK和第k-1次迭代累计失真DK-1,若|DK-DK-1|/DK小于所述停止门限ε,则转到步骤C4执行,否则求出新的形心及对应的当前码书,再迭代执行步骤C3;C4、判断有无典型胞腔,若最大胞腔的矢量数与最小胞腔的矢量数之比大于等于所述训练矢量序列的个数,则转到步骤C2执行,否则获取新的质心,即将最大胞腔的码字与扰动因子相乘得到新的码字来代替原有最大和最小胞腔的码字,转到步骤C3执行;C5、当当前码书体积小于NB时,完成码书的建立,确定增益码书。5.根据权利要求3所述的一种建立增益码书的方法,其特征在于所述步骤B3包括B31、设置所述训练矢量序列中第n个子帧的无偏对数能量预测误差en,所述en=Etn-En%]]>,其中En%为第n个子帧无偏对数能量的预测值;B32、由所述无偏对数能量预测误差得到所有误差的平方和ERR,并根据所述平方和ERR微分求出所述随机激励信号无偏对数能量 的线性预测系数。6.根据权利要求3所述的一种建立增益码书的方法,其特征在于所述步骤B3具体包括令En%为第n子帧无偏对数能量的预测值,即En%=Σi=1pbiEtn-i]]>上式中bi为预测器系数,p为预测器阶数。p的取值与编码器的子帧长度有关,令en=Etn=En%]]>为增益码书训练矢量集合中第n子帧的无偏对数能量预测误差。则所有训练数据误差的平方和为ERR=Σn=3Nfen2=Σn=3Nf(Etn-En%)2=Σn=3Nf(Etn-Σi=1pbiEtn-i)2]]>其中,Nf为训练码矢个数,令ERR/bi=0,可以得到一个p元一次线性方...
【专利技术属性】
技术研发人员:鲍长春,窦庚欣,范睿,朱恒,李立雄,
申请(专利权)人:北京工业大学,华为技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。