当前位置: 首页 > 专利查询>索尼公司专利>正文

语音处理装置、方法和程序制造方法及图纸

技术编号:7796205 阅读:182 留言:0更新日期:2012-09-24 17:50
本申请涉及语音处理装置、方法和程序。语音处理装置包括对输入语音信号执行音高变换处理并且对输入语音信号的音高进行变换的音高变换单元,检测所预期的输出语音信号的样本数目与实际输出的输出语音信号的样本数目之间的误差的误差检测单元,以及以通过误差的数量校正输出语音信号的时间长度的方式来控制对时间长度的调节的时间长度控制单元。

【技术实现步骤摘要】

本公开涉及语音处理装置、语音处理方法和程序,特别涉及其中在对语音信号的音高(voice pitch)进行变换的情况下可以抑制输出语音的伸缩变化的语音处理装置、语音处理方法和程序。
技术介绍
对语音或乐曲的语音信号中的音高进行变换的技术已被用于卡拉OK中的音调(key)控制、用于乐器训练的基准音乐的音调改变,或者相关技术中的类似情况。当一个充当基准的语音信号被准备时,期望的音调可被获得,并且这还引起存储器的节省,因此这种音高变换处理是有用的技术。例如,作为对语音信号的音高进行变换的方法,其中通过采样速率变换器来改变语音波形的周期的方法可被例示。在该方法中,语音信号可被变换为具有期望音高的语音信号,但是变换前后的语音信号的样本数目发生变化。因此,一般而言,如在音高变换处理装置中期望的,为了获得与输入数据的样本数目相同的输出数据的样本数目,通过诸如PICOLA(指针间隔受控重叠和添加)之类的时间伸缩处理来执行对输出数据的样本数目的调节(例如,参考“Morita,Itakura voice expansion and contraction on a time axis using PICOLA(Pointer IntervalControlled Overlap and Add), and an evaluation thereof,日本声学协会论文集,1986年 10 月,第 149-150 页”)。
技术实现思路
然而,在这种技术中,在语音信号经受音高变换的情况下,发生输出语音的伸缩变化,因而难以获得高质量的语音。例如,在音高将被变换的语音信号经受诸如PICOLA之类的时间伸缩处理的情况下,语音信号的时间长度可被调节为大体期望的长度,但是因为该处理是以音高长度或者帧长度作为单位来执行的,因此由于处理单位而被施加限制。因此,语音信号的时间长度可能不被精确地变换为所期望的时间长度,并且在通过音高变换获得的语音中可能发生伸缩变化。此外,在由采样速率变换器等执行音高变换的情况下,在对语音信号的时间伸缩处理中,利用音高变换中的语音的时间伸缩比的倒数来执行对时间长度的调节,但是时间伸缩比的倒数不一定变为有理数。这样,在时间伸缩比的倒数不变为有理数的情况下,在用于时间伸缩处理的时间伸缩比中可能发生误差,使得语音信号的时间长度可能不被准确地变换为期望的时间长度。希望在对语音信号的音高进行变换的情况下抑制输出语音的伸缩变化。根据本公开的一个实施例,提供了一种语音处理装置,包括对输入语音信号执行音高变换处理并且对所述输入语音信号的音高进行变换的音高变换单元;检测所预期的输出语音信号的样本数目与实际输出的输出语音信号的样本数目之间的误差的误差检测单元;以及以通过所述误差的数量校正所述输出语音信号的时间长度的方式来控制对所述时间长度的调节的时间长度控制单元。所述误差检测单元可以基于所述输入语音信号的样本数目、所输出的所述输出语音信号的样本数目以及所述输入语音信号的未经处理的样本的数目来检测所述误差。所述语音处理装置还可以包括时间伸缩处理单元,该时间伸缩处理单元对所述输入语音信号执行时间伸缩处理,并且调节所述输入语音信号的时间长度。所述语音处理装置还可以包括精简和插入单元,该精简和插入单元根据所述时间长度控制单元的控制对被执行了所述音高变换处理的输入语音信号执行样本精简或者样本插入,并且调节所述时间长度。所述语音处理装置还可以包括变换单元,该变换单元根据所述时间长度控制单元的控制对被执行了所述音高变换处理的输入语音信号执行采样速率变换,并且调节所述时间长度。所述语音处理装置还可以包括重叠处理单元,该重叠处理单元根据所述时间长度控制单元的控制对被执行了所述音高变换处理的输入语音信号执行重叠处理,并且调节所述时间长度,所述重叠处理利用了具有由所述误差决定的长度的窗口。所述语音处理装置还可以包括时间伸缩处理单元,该时间伸缩处理单元根据所述时间长度控制单元的控制以由所述误差决定的时间伸缩比对所述输入语音信号执行时间伸缩处理,并且调节所述时间长度。根据本公开的另一实施例,提供了一种语音处理方法或程序,包括对输入语音信号执行音高变换处理并且对所述输入语音信号的音高进行变换;检测所预期的输出语音信号的样本数目与实际输出的输出语音信号的样本数目之间的误差;以及以通过所述误差的数量校正所述输出语音信号的时间长度的方式来控制对所述时间长度的调节。根据本公开的实施例,音高变换处理被对输入语音信号执行并且输入语音信号的音高被变换;所预期的输出语音信号的样本数目与实际输出的输出语音信号的样本数目之间的误差被检测;并且对时间长度的调节被以通过所述误差的数量校正所述输出语音信号的时间长度的方式来控制。根据本公开的实施例,在对语音信号的音高进行变换的情况下,输出语音的伸缩变化可被抑制。附图说明图I是图示出根据第一实施例的音高变换装置的配置示例的示图;图2是图示出音高变换处理的流程图;图3是图示出音高变换装置的另一配置示例的示图;图4是图示出音高变换处理的流程图;图5是图示出音高变换装置的另一配置示例的示图;图6是图示出音高变换处理的流程图; 图7是图示出音高变换装置的另一配置示例的示图;图8是图示出音高变换处理的流程图9是图示出音高变换装置的另一配置示例的示图;图10是图示出音高变换处理的流程图;图11是图示出重叠处理的示图;图12是图示出窗口函数的示例的示图;图13是图示出重叠处理的示图;图14是图示出窗口函数的示例的示图;图15是图示出音高变换装置的另一配置示例的示图;图16是图示出音高变换处理的流程图; 图17是图示出音高变换装置的另一配置示例的示图;图18是图示出音高变换处理的流程图;图19是图示出音高变换装置的另一配置示例的示图;图20是图示出音高变换处理的流程图;并且图21是图示出计算机的配置示例的示图。具体实施例方式在下文中,将参考附图描述本技术所应用于的实施例。第一实施例音高变换装置的配置示例图I示出了本技术所应用于的根据第一实施例的音高变换装置的配置示例。音高变换装置11对输入语音信号执行音高变换处理,并且输出其中音高(语音的音调的高度)被变换的语音信号。此外,在以下描述中,输入到音高变换装置11的语音信号也被称为输入语音信号,并且从音高变换装置11输出的语音信号也被称为输出语音信号。此外,作为将经受音高变换处理的对象的语音信号可以是诸如人的语音、乐曲等的任何语音的信号。音高变换装置11包括缓冲器21、误差检测单元22、时间长度控制单元23、音高变换单元24、时间伸缩处理单元25以及精简和插入单元26。缓冲器21临时存储所输入的输入语音信号,并且将其提供给音高变换单元24。误差检测单元22基于所输入的输入语音信号、存储在缓冲器21中的未经处理的语音信号以及从精简和插入单元26提供的输出语音信号,来检测实际输出的输出语音信号的样本数目与期望的输出语音信号的样本数目之间的误差。误差检测单元22将检测到的误差提供给时间长度控制单元23。时间长度控制单元23基于从误差检测单元22提供的误差执行对语音信号的时间长度调节的控制。就是说,时间长度控制单元23对精简和插入单元26给出调节语音信号的时间长度(即语音信号的样本数目)的指令。音高变换单本文档来自技高网...

【技术保护点】

【技术特征摘要】
2011.03.17 JP 2011-0589561.一种语音处理装置,包括 音高变换单元,该音高变换单元对输入语音信号执行音高变换处理并且对所述输入语音信号的音高进行变换; 误差检测单元,该误差检测单元检测所预期的输出语音信号的样本数目与实际输出的输出语音信号的样本数目之间的误差;以及 时间长度控制单元,该时间长度控制单元以通过所述误差的数量校正所述输出语音信号的时间长度的方式来控制对所述时间长度的调节。2.根据权利要求I所述的语音处理装置, 其中,所述误差检测单元基于所述输入语音信号的样本数目、所输出的所述输出语音信号的样本数目以及所述输入语音信号的未经处理的样本的数目来检测所述误差。3.根据权利要求I所述的语音处理装置,还包括 时间伸缩处理单元,该时间伸缩处理单元对所述输入语音信号执行时间伸缩处理,并且调节所述输入语音信号的时间长度。4.根据权利要求I所述的语音处理装置,还包括 精简和插入单元,该精简和插入单元根据所述时间长度控制单元的控制对被执行了所述音高变换处理的输入语音信号执行样本精简或者样本插入,并且调节所述时间长度。5.根据权利要求I所述的语音处理装置,还包括 变换单元,该变换单元根据所述时间长度控制单元的控制对被执行了所述音高变换处理的输入语音信号执行采样速率变换,并且调节所述时间长度。6.根据权利要求I...

【专利技术属性】
技术研发人员:向井昭广井上晃
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利