语音信号内插的装置和方法制造方法及图纸

技术编号:3046712 阅读:180 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种语音信号内插装置,其能从语音压缩状态恢复自然人声并保持高的音质。当表征将被内插的语音的语音信号由语音数据输入单元1获得时,基音获得单元2对这个语音信号进行滤波以从滤波结果确定音长。音长固定单元3使语音信号具有对应单位基音的段的恒定时长,并产生基音波形数据。子带分割单元4转换基音波形数据为表征频谱的子带数据。多个子带数据被平均单元5进行平均,然后,子带合成单元6转换子带数据为表征子带合成单元6的语音波形的信号。每段的时长由基音恢复单元7恢复,并且声音输出单元8重放信号表示的声音。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音信号内插的装置、方法和程序。
技术介绍
如今音乐节目等通过有线或射频广播或通信广泛地分布。如果频带太宽,为了广播音乐等类似的节目,防止音乐数据量过大并拓宽所占频带是很重要的。为避免这个问题,音乐数据在利用结合在频率掩蔽方法的语音压缩格式进行压缩后被分布,比如MP3(MPEG1音频层3)格式和AAC(高级音频编码)格式。频率掩蔽方法是利用一种现象来压缩语音的,该现象即人类很难听到低级声音信号的频谱成分,所述低级声音信号的频率接近高级声音信号的频谱成分。图4(b)表示利用频率掩蔽方法压缩如图4(a)所示的频谱的原始声音的结果图,(图4(a)表示获得由以MP3格式压缩人类产生的语音的频谱的一个示例)。如图所示,如同由频率掩蔽方法压缩的语音,一般具有2KHz或者更高的频率的成分大量丢失,甚至接近提供频谱峰值的、低于2KHz的成分(语音的基频成分和谐波成分的频谱)也大量丢失。在日本未决的公开号为2001-356788专利公开的方法中,内插压缩的语音频谱来获得原始语音频谱。根据这个方法,内插频带是从压缩后的频谱剩余中获得,表示与在内插频带中相同的分布的频谱成分被插入到由本文档来自技高网...

【技术保护点】
一种语音信号内插装置,其包括:基音波形信号产生装置,用来获取代表语音波形的输入语音信号并且使与所述的输入语音信号的单位基音对应的一段时长充分相同,以将所述的输入语音信号转换为基音波形信号;频谱获得装置,用来根据基音波形信号产 生代表所述输入语音信号频谱的数据;平均装置,用来根据由所述频谱获得装置产生的多个数据,产生代表所述输入语音信号的各个频谱成分平均值分布的平均数据;和语音信号恢复装置,用来产生输出语音信号,其代表具有由所述平均装置产生的平均数 据表征的频谱的语音。

【技术特征摘要】
JP 2002-6-7 167453/20021.一种语音信号内插装置,其包括基音波形信号产生装置,用来获取代表语音波形的输入语音信号并且使与所述的输入语音信号的单位基音对应的一段时长充分相同,以将所述的输入语音信号转换为基音波形信号;频谱获得装置,用来根据基音波形信号产生代表所述输入语音信号频谱的数据;平均装置,用来根据由所述频谱获得装置产生的多个数据,产生代表所述输入语音信号的各个频谱成分平均值分布的平均数据;和语音信号恢复装置,用来产生输出语音信号,其代表具有由所述平均装置产生的平均数据表征的频谱的语音。2.如权利要求1所述的语音信号内插装置,其中,所述的基音波形信号产生装置包括可变滤波器,它的频率特征被控制为可变的,可变滤波器对所述输入语音信号进行滤波以获得输入语音的基频成分;滤波器特征确定装置,用于根据所述可变滤波器获得的基频成分来识别输入语音的基频、并控制所述可变滤波器使得频率特征截止除了在识别的基频附近的频率分量之外的频率成分;基音获得装置,用来根据由所述可变滤波器获得的基频成分值,分割所述输入语音信号成在与单位基音相应的段内的一语音信号;和音长固定装置,用来通过以充分相同的采样数目来采样所述输入语音信号的每段来产生基音波形信号,该基音波形信号具有在每段中充分相同的时长。3.如权利要求2所述的语音信号内插装置,其中,所述滤波器特征确定装置包括交叉检测装置,用来识别所述可变滤波器获得的基频成分达到预定值的定时周期,并根据所述识别的周期来识别基频。4.如权利要求3所述的语音信号内插装置,其中,所述滤波器特征确定装置可包括平均基音检测装置,用来根据所述输入语音信号、在被滤波前检测所述输入语音信号代表的语音的基音的时长;和判断装置,判断所述交叉检测装置识别的周期和所述平均基音检测装置识别的基音的...

【专利技术属性】
技术研发人员:佐藤宁
申请(专利权)人:株式会社建伍
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1