当前位置: 首页 > 专利查询>索尼公司专利>正文

数据处理装置制造方法及图纸

技术编号:3422935 阅读:157 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及能够得到高音质的合成音等的数据处理装置。分支生成部121从对以CELP方式进行编码的语音的编码数据解码后的合成音数据中正在关注的关注数据的子帧中的40个样值的合成音数据和以从关注子帧过去其关注子帧中配置的L码所表明的延迟量的位置为起点的40个样值的合成音数据生成预测分支。然后,预测部125通过用其预测分支和系数存储器124所记忆的分支系数进行规定的预测运算来对高音质的语音数据解码。本发明专利技术可应用于对语音进行收发信的使携式电话机。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据处理装置,尤其涉及能够将以例如CELP(CodeExcited Liner Prediction coding)方式被编码了的语音解码为高音质的语音的数据处理装置。
技术介绍
图1及图2表示现有的便携式电话机一例的结构。在该便携式电话机中进行将语音根据CELP方式编码为规定的编码并发送的发送处理和接收其他便携式电话机所发送的编码并将其解码为语音的接收处理,图1表示进行发送处理的发送部,图2表示进行接收处理的接收部。在图1所示的发送部,用户讲话的语音输入至话筒(麦克风)1,在此转换成作为电信号的语音信号并供给至A/D(Analog/Digital)转换部2。A/D转换部2将来自话筒1的模拟的语音信号例如通过以8KHz等的采样频率进行采样A/D转换成数字的语音信号,再以规定的比特数进行量子化并供给至运算器3和LPC(Liner PredictionCoefficient)分析部4。LPC分析部4将来自A/D转换部2的语音信号例如以160个样值长度为1帧,并将该1帧分割为各40个样值的子帧,按各子帧进行LPC分析,求出P次的线性预测系数α1,α2,…,αP。然后,LPC分析部4将以该P次的线性预测系数αp(p=1、2、…、P)为要素的矢量作为语音的特征矢量供给至矢量量子化部5。矢量量子化部5记忆使以线性预测系数为要素的编码矢量与编码相互对应的码簿,并根据该码簿将来自LPC分析部4的特征矢量α矢量量子化,并将该矢量量子化的结果所得的编码(以下适当称之为A编码(A_code))供给至码决定部15。再有,矢量量子化部5将成为构成与A编码对应的编码矢量α’的要素的线性预测系数α1’、α2’、…、αP’供给至语音合成滤波器6。语音合成滤波器6例如在IIR(Infinite Impulse Response)型的数字滤波器将来自矢量量子化部5的线性系数αp’(p=1、2、…、P)作为IIR滤波器的分支系数,同时将运算器14所供给的残留信号e作为输入信号并进行语音合成。即,LPC分析部4所进行的LPC分析为假设在当前时刻n的语音信号(的样值)sn及与其相邻的过去的P个样值sn-1、sn-2、…、sn-P中,下式sn+α1sn-1+α2sn-2+……+αPsn-P=en……(1)所表示的线性一次结合成立,并用过去的P个样值值sn-1、sn-2、…、sn-P将当前时刻n的样值sn的预测值(线性预测值)sn’根据下式sn’=-(α1sn-1+α2sn-2+……+αPsn-P)……(2)进行线性预测后,求出令实际的样值sn与线性预测值sn’之间的平方误差最小的线性预测系数αP。在此,式(1)中,{en}(…、en-1、en、en+1、…)的平均值为0、偏离为规定值σ2的互不相关的概率变量。根据式(1),样值sn可由下式sn=en-(α1sn-1+α2sn-2+……+αPsn-P)……(3)表示,将其进行Z转换则下式成立。s=E/(1+α1z-1+α2z-2+……+αPz-P) ……(4)不过在式(4)中,S和E分别表示式(3)的sn和en的Z转换。在此,根据式(1)及式(2),en可由下式en=sn-sn’ ……(5)表示,并称之为实际的样值sn与线性预测值sn’之间的残留信号。因而,根据式(4),可以通过将线性预测系数αP作为IIR滤波器的分支系数,同时将残留信号en作为IIR滤波器的输入信号而求出语音信号sn。因此,语音合成滤波器6如上述将来自矢量量子化部5的线性预测系数αP’作为分支系数时,同时将运算器14所供给的残留信号e作为输入信号,进行式(4)的运算并求出语音信号(合成音数据)ss。另外,因为语音合成滤波器6不是采用LPC分析部4的LPC分析的结果所得的线性预测系数αP,而是采用作为与该矢量量子化的结果所得的编码对应的编码矢量的线性预测系数αP’,所以语音合成滤波器6输出的合成音信号与A/D转换部2输出的语音信号基本上不相同。语音合成滤波器6输出的合成音数据ss供给至运算器3。运算器3从来自语音合成滤波器6的合成音数据ss减去A/D转换部2输出的语音信号s(从合成音数据ss的各样值减去对应于该样值的语音数据s的样值),并将该相减值供给至平方误差运算部7。平方误差运算部7对来自运算器3的相减值的平方和(关于第k子帧的各样值的相减值的平方和)进行运算,并将其结果所得的平方误差供给至平方误差最小判定部8。平方误差最小判定部8与平方误差运算部7输出的平方误差相对应,记忆有作为表示长期预测延迟的编码的L码(L_code)、作为表示增益的编码的G码(G_code)及作为表示码语(激励码簿)的编码的I码(I_code),并输出对应于平方误差运算部7所输出的平方误差的L码、G码及L码。L码供给至自适应码簿记忆部9,G码供给至增益解码器10,I码供给至激励码簿记忆部11。再有,L码、G码及I码也供给至码决定部15。自适应码簿记忆部9例如对7比特的L码与规定的延迟时间(延迟)相互对应的自适应码簿进行记忆,其将运算器14所供给的残留信号e延迟与平方误差最小判定部8所供给的L码相对应的延时时间(长期预测延迟)量,并输出至运算器12。在此,因为自适应码簿记忆部9将残留信号e延迟对应于L码的时间量后输出,所以该输出信号将成为以该延迟时间为周期的周期信号。在利用了线性预测系数的语音合成中,该信号主要成为用以生成语言声的合成音的驱动信号。因而,L码在概念上表示语音的节拍周期。另外,根据CELP的规格,L码取20至146的范围的整数值。增益解码器10记忆G码与规定的增益β及γ相对应的表格,并输出对应于平方误差最小判定部8所供给的G码的增益β及γ。增益β和γ分别供给至运算器12和13。在此,增益β被称为长期滤波状态输出增益,另外,增益γ被称为激励码簿增益。激励码簿记忆部11例如对9比特的I码与规定的激励信号相对应的激励码簿进行记忆,并将对应于平方误差最小判定部8所供给的I码的激励信号输出至运算器13。在此,记忆于激励码簿的激励信号例如为与白澡声等相近的信号,其在利用了线性预测系数的语音合成中主要成为用以生成非语言声的合成音的驱动信号。运算器12将自适应码簿记忆部9的输出信号与增益解码器10输出的增益β相乘,并将该相乘值1供给至运算器14。运算器13将激励码簿记忆部11的输出信号与增益解码器10输出的增益γ相乘并将该相乘值n供给至运算器14。运算器14将来自运算器12的相乘值1与来自运算器13的相乘值n相加,并将该相加值作为残留信号e供给至语音合成滤波器6和自适应码簿记忆部9。在语音合成滤波器6中,如上所述,用以矢量量子化部5所供给的线性预测系数αp’为分支系数的IIR滤波器将运算器14所供给的残留信号e滤波,并将其结果所得的合成音数据供给至运算器3。然后,在运算器3及平方误差运算部7中进行与上述情况同样的处理,并将其结果所得的平方误差供给至平方误差最小判定部8。平方误差最小判定部8判定来自平方误差运算部7的平方误差是否为最小(极小)。而且,当平方误差最小判定部8判定为平方误差非最小时,如上述输出对应于该平方误差的L码、G码及I码,以下重复同样的处理。另一方面,当平方误差最小判定部8判定为平方误差最小时,将确定信号本文档来自技高网...

【技术保护点】
一种对规定数据和表示周期的周期信息进行处理的数据处理装置,其特征为:具备 通过关于所述规定数据中的正在关注的关注数据根据所述周期信息抽出所述规定数据来生成用于规定处理的分支的分支生成单元; 用所述分支对所述关注数据进行规定处理的处理单元。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:近藤哲二郎木村裕人渡边勉服部正明
申请(专利权)人:索尼公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利