声音信号生成方法、声音信号生成装置以及计算机程序制造方法及图纸

技术编号:5680009 阅读:166 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供通过对原音信号进行加工生成加工声音信号来合成对噪声感、粗糙感等音质劣化进行了抑制的高质量语音的声音信号生成方法、声音信号生成装置以及计算机程序。本发明专利技术按照波形的间距单位分离原音信号,生成多个单位波形信号,针对各单位波形信号,生成重复波形信号,该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的,通过按照形成原音信号的顺序以间距为单位使各个重复波形信号移动后进行叠加,来生成加工声音信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对原音信号进行加工来生成加工声音信号的声音信号生成方法、应用了该声音信号生成方法的声音信号生成装置以及用于实现该声音信号生成装置的计算机 程序。
技术介绍
近年来,通过语音来朗读邮件以及网站内容的文本数据的功能已被安装在例如便 携电话等嵌入设备中。在实现这样的语音朗读功能的语音合成处理中,预先在内置存储器 等i己录单元中i己录通过ADPCM(AdaptiveDifferential Pulse Code Modulation,自适应差 分脉冲编码调制)等压縮方法对合成语音所需的语音单元数据进行压縮而记录的数据库 即波形库。并且,在生成合成语音波形时,从波形库中读取所压縮的语音单元数据(speech segment data),进行解压解码,对解压解码得到的语音单元数据进行结合,并进行音高以 及语速的调整等加工处理,由此生成语音信号,根据所生成的语音信号输出合成语音。 语音单元的生成方法以及语音合成方法例如在专利文献1中有所公开。 但是,通过对使用ADPCM等压縮方法压縮的语音信号进行解压解码而生成的语音 有时产生噪声感、粗糙感等音质劣化。另外,在结合多个语音单元数据、调整语音的音高以 及语速时,也有时产生噪声感、粗糙感等音质劣化。 图1是示出所生成的语音信号的波形的图。图l(a)示出了通过对所压縮的语音 信号进行解压解码来生成的语音信号的波形,由于不可逆压縮带来的压縮以及解压时的噪 声,所生成的语音信号的周期波形的各个间距中的振幅不尽相同。由于这样的各个间距的 偏差、不平滑的变化等原因,在基于所生成的语音信号的合成语音中产生了噪声感、粗糙感 等音质劣化。 图l(b)示出了在减慢语音的速度即所谓语速时生成的语音信号的波形,通过以间距为单位使同一语音单元的语音信号分别连续预定次数,生成了减慢语速的声音信号。对于这样的语音信号,间距波形的振幅变化变成阶梯状,成为音质劣化的原因。 作为防止这样的语音劣化的方法,存在通过降低压縮时的压縮率来防止由于不可逆压縮而产生的噪声的方法。另外,还存在下述方法针对短时间内通过FFT处理将合成后的语音信号转换成频率轴上的成分而生成的频谱进行噪声消除处理后,通过FFT逆处理恢复成原来时间轴上的声音信号,由此防止语音劣化。 专利文献1 :日本特开平8-160991号公报 但是,在降低压縮率的方法中,存在波形库所需的存储器容量增大的问题,在通过 频率转换来消除噪声的方法中存在处理负荷增大的问题。当安装在受存储器容量以及处理 能力的制约较大的便携电话等嵌入设备中时,这些问题成为不可忽视的问题。另外,从减少 伴随运算处理的功耗的角度来看,也期望解决上述问题。
技术实现思路
本专利技术是鉴于该情况而完成的,其目的在于提供能够用较少的处理量不破坏原来的音质、减少在压縮解压、语音合成等处理中产生的音质劣化的声音信号生成方法、应用了 该声音信号生成方法的声音信号生成装置以及用于实现该声音信号生成装置的计算机程 序。 第1专利技术的声音信号生成方法对原音信号进行加工,生成加工声音信号,该原音信号具有重复大致相同波形的周期性间距,该声音信号生成方法的特征在于,按照波形的间距单位分离原音信号,生成多个单位波形信号;针对各单位波形信号,生成重复波形信 号,该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的;以及通过 按照形成原音信号的顺序以间距为单位使各个重复波形信号移动后进行叠加,来生成加工声音信号。 第2专利技术的声音信号生成装置对原音信号进行加工,生成加工声音信号,该原音 信号具有重复大致相同波形的周期性间距,该声音信号生成装置的特征在于,该声音信号 生成装置具有记录单元,其记录原音信号;读取单元,其读取记录在该记录单元中的原音 信号;第1生成单元,其按照波形的间距单位分离所读取的原音信号,生成多个单位波形信 号;第2生成单元,其针对各单位波形信号,生成连续波形信号,该连续波形信号是使单位 波形信号的波形连续预定次数而得到的;以及第3生成单元,其生成加工声音信号,该加工 声音信号是按照形成原音信号的顺序以间距为单位使各个连续波形信号移动后进行叠加 而得到的。 第3专利技术的声音信号生成装置特征在于,在第2专利技术中该声音信号生成装置还具 有第4生成单元,其通过对所述第1生成单元所生成的连续的多个单位波形信号进行加权 合成,生成起始端和结束端的振幅一致的单位波形信号,所述第2生成单元构成为,使第4 生成单元所生成的单位波形信号连续,来生成连续波形信号。 第4专利技术的声音信号生成装置特征在于,在第2专利技术或第3专利技术中该声音信号生 成装置还具有滤波单元,其进行对加工声音信号的预定波长以上的振幅进行加重的高频 加重处理。 第5专利技术的声音信号生成装置特征在于,在第4专利技术中,所述原音信号是语音信号,该声音信号生成装置还具有判定所述原音信号是有声还是无声的单元,所述滤波单元构成为,仅对基于被判定为有声的原音信号的加工声音信号进行高频加重处理。 第6专利技术的声音信号生成装置特征在于,在第2专利技术至第5专利技术中所述原音信号是语音信号,该声音信号生成装置还具有输出基于所生成的加工声音信号的语音的单元。 第7专利技术的计算机程序使计算机对原音信号进行加工,生成加工声音信号,该原音信号具有重复大致相同波形的周期性间距,该计算机程序的特征在于,该计算机程序使计算机执行下述步骤按照波形的间距单位分离原音信号,生成多个单位波形信号的步骤;针对各单位波形信号,生成连续波形信号的步骤,该连续波形信号是使单位波形信号的波形连续预定次数而得到的;以及生成加工声音信号的步骤,该加工声音信号是按照形成原音信号的顺序以间距为单位使各个连续波形信号移动后进行叠加而得到的。 在第1专利技术、第2专利技术、第6专利技术以及第7专利技术中,可生成在抑制作为声音劣化原因的连续的间距单位波形的急剧变化的同时、几乎不破坏原来的声音信号的频谱包络形状5的声音信号,因此尽管是较少的处理量但也能够减少音质劣化,而不会破坏原来的音质。 在第3专利技术中,通过使单位波形信号的起始端与结束端的振幅一致,可防止在所 生成的连续波形信号中单位波形信号的相邻区间不连续,防止基于波形的不连续性的音质 劣化。 在第4专利技术中,能够对由于使波形信号叠加的平滑化处理而降低的高波长区域的 振幅进行加重,因此可保持原来的音质。 在第5专利技术中,通过仅对受平滑化处理的影响较大的有声进行高频加重处理,可防止对无声的高频进行过分加重,而破坏原来的音质成为剌耳的声音的问题。 本专利技术的声音信号生成方法、声音信号生成装置以及计算机程序按照波形的间距单位分离语音单元数据等原音信号的数据,生成多个单位波形信号;针对各单位波形信号,生成重复波形信号,该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的;以及通过按照形成原音信号的顺序以间距为单 位使各个重复波形信号移动后进行叠加,来生成加工声音信号。 根据该结构,在本专利技术中,由于进行使间距单位波形的时间变化均匀的处理,因此 可生成在抑制作为语音劣化原因的连续的间距单位波形的急剧变化的同时,几乎不破坏原 来的声音信号的频谱包络形状的声音信号。其结果,尽管是较少的处理量但也能够减少音 质劣化,而不会破坏原来的音质。因此,本专利技术起到了如下等良好的效果,即当本文档来自技高网
...

【技术保护点】
一种声音信号生成方法,其对原音信号进行加工,生成加工声音信号,该原音信号具有重复大致相同波形的周期性间距,该声音信号生成方法的特征在于,按照波形的间距单位分离原音信号,生成多个单位波形信号;针对各单位波形信号,生成重复波形信号,该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的;以及通过按照形成原音信号的顺序以间距为单位使各个重复波形信号移动后进行叠加,来生成加工声音信号。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:渡边一宏
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1