声音强调装置及声音强调方法制造方法及图纸

技术编号:4504007 阅读:164 留言:0更新日期:2012-04-11 18:40
一种声音强调装置,通过使所述的“用力”声音出现在讲话者或用户试图附加强调或者音乐表现的位置上,从而附加由愤怒、兴奋或紧张、精力充沛的说话方式所表现的强调,及附加演歌、布鲁斯歌曲或者摇滚乐等的音乐表现,以实现丰富的声音表现,该声音强调装置包括:强调发音区间检测部(12),检测输入声音波形之中的强调区间,所述强调区间是指发出该输入声音波形的发声者想要使声音波形发生变化的时间区间;以及声音强调部(13),使所述输入声音波形之中的、由所述强调发音区间检测部(12)检测出的所述强调区间所包含的声音波形的振幅包络的波动增加。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及生成与普通的发音具有不同特点的声音的"用力"声音的 技术,所谓"用力"声音是指,人的歌声或在为了强调讲话内容而用力加强语气时出现的嘶哑的声音、粗鲁的声音、或者刺耳的声音(harshvoice), 例如在唱演歌等时出现的"花腔(C A L )"或"哼声(念")之类的表现, 或者,在演唱布鲁斯歌曲或摇滚乐等时出现的"喊叫声"之类的表现。本 专利技术尤其涉及声音强调装置,该声音强调装置能够生成能够表现如上所述 的声音所包含的愤怒、重音、强有力以及精力充沛的感情或声音的表现力、 说话风格或讲话者的态度、状况、或发音器官的紧张状态的声音。
技术介绍
以往,开发了以声音来表现感情、表现力、态度及状况等的、尤其不 是以语言的声音来表现,而是以通过所谓口气、说话的方式及声调之类的 副语言的表现来表达感情等为目的声音转换或者声音合成的技术。这些技 术对于从机器人或者电子秘书到电子设备的声音对话接口都是必不可少 的。而且,作为应用于卡拉OK或者用于音乐的效应器的技术,开发了对 声音波形进行加工以附加颤音等音乐性表现的技术,或强调声音的表现的 技术。在声音的副语言性表现或音乐性表现之中,作为实现根据音质的表现 的方法,存在对输入的声音进行分析从而求出合成参数,并通过改变此参 数来改变音质的声音转换方法的提案(例如,参考专利文献1)。但是,在 上述以往的方法中,是按照以每种感情来预先规定的同样的转换规则进行 参数转换。因此,不能够再现如在自然说话中所能见到的、 一部分成为用 了力的声音的音质的变化。而且,对于全体输入声音适用同样的转换规则。 因此,不能适应如只对讲话者想要强调的部分进行转换,以及如对输入声 音的原有的表现力或表现的强弱进行强调的转换。并且,还提出了在卡拉OK中,将用户的歌唱改变成模仿了原唱歌手 的唱法的歌唱的方法的提案(例如,专利文献2)。也就是,根据歌唱数据, 对用户的歌声进行改变振幅或基频,以及附加噪声等的变形处理,该歌唱 数据中记述了所谓原唱歌手的唱法、即在乐曲之中的哪个区间使用了哪种 程度的颤音,是否包含"用力声音"或"哼声"之类的音乐性表现。进而,还提出了针对歌唱数据与原唱歌手的歌唱定时的偏差,进行歌 唱数据和乐曲数据的比较的方法的提案(例如,专利文献3)。若将这些技 术组合在一起,则即使在歌唱数据与原唱歌手的歌唱定时相比具有偏差的 情况下,只要大致的定时相符,就有可能将输入声音转换成模仿了原唱歌 手的唱法的歌唱。关于声音的一部分的音质的变化,进行了作为"用力声音"的,也称 为"紧喉嗓音"(creaky)或者"声带微颤而发出的弱声"(vocal fry)的 声音的研究,该"用力声音"不同于作为本申请所设定的对象的、在兴奋 之际的发音中歌唱声音的表现的"用力"声音或"哼声"的声音。作为"紧 喉嗓音"的声特征,非专利文献1举出了以下特征局部的能量的变化剧 烈;基频比普通发音时的基频低,且不稳定;比普通发音的区间的强度小。 并且,揭示出存在由于通过喉头用力而使声带震动的周期性紊乱,从而产 生这些特征的情况。进而,揭示出与音节单位的平均持续时间相比,经过 长区间产生"用力声音"的情况较多。"紧喉嗓音"被作为在关心或厌恶的 感情的表现中,或者在踌躇或谦逊的态度的表现中,具有提高讲话者的诚 实感的效果的音质。在非专利文献1中论述的"用力声音"在一般的文章 结尾部分或句尾等声音逐渐消失的过程中;在边选词边说话、边考虑边说 话之时,拖拉词尾式的拉长词尾发音的情况下的被拉长了的词尾;以及在 不知如何回答之时发出的"A — , t (这个……)"",一/u (嗯)"之类的感叹词里经常可见。进而,非专利文献l揭示了 "声带微颤而发出的弱声" 及"紧喉嗓音"里包含有以双拍节或者以基本周期的倍数而发生的新的周 期的双音(diplophonia)。作为生成在"声带微颤而发出的弱声"里可见 的被称为双音(diplophonia)的声音的方式,将错开了基频的二分之一周 期的相位的声音重叠的方法被提案。专利文献1:(日本)特许第3703394号公报专利文献2 :(日本)特开2004-177984号公报 专利文献3:(日本)特许第3760833号公报非专利文献1:石井力A 口》寿憲、石黑浩扭J:"萩田紀博、「 Q §办 o自動検出o &灼o音響分析」、電子情報通信学会技術研究報告、SP2006 —07巻、pp.l — 6、 2006 (石井Carlos寿宪、石黑浩及萩田纪博、"用于 自动检测用力声音的声学分析"、电子信息通信学会技术研究报告、SP2006 —07巻、pp.l-6、 2006)但是,通过上述以往的方法或者这些方法的组合无法生成如在兴奋、 紧张、愤怒或者为了强调而用力加强语气讲话时出现的嘶哑的声音、粗鲁 的声音或者刺耳的声音(harsh voice),还有如唱歌时出现的"花腔"、"哼 声"或"喊叫声"那样的声音的一部分中出现的"用力"声音。在此,"用 力"声音是在用力说话时,由于发音器官比在一般情况下用力或者由于发 音器官极度紧张而引起的。具体而言,因为"用力"声音是用了力的发音, 所以声音的振幅算是比较大的。而且,"用力"声音不仅限于感叹词,还能 在无论独立词或者辅助词的各种各样的词类中见到。即,"用力声音"是与 上述以往的方法所实现的"用力声音"不同的声音现象。因此,通过以往 的方法无法生成本申请所设定的对象的"用力"声音。即,存在通过生成 能感觉到发音器官的用力方式及紧张方式的"用力"声音,难以将如愤怒 或兴奋、满怀信心的说话方式或者精力充沛的说话方式那样的声音的表现 力以音质的变化来丰富地表现的问题。进而,在歌声的转换中,歌唱数据 被固定为原唱歌手的歌唱定时。因此,不能附加在用户以与原唱歌手的定 时大不相同的定时演唱的情况下的音乐表现。并且,在与原唱歌手不同的, 用户在想要的定时附加"用力声音"或"哼声"来演唱的情况下,或者在 原本没有歌唱数据的情况下,不能反映出想要附加"用力声音"来演唱的 欲望或想法。艮口,在上述以往的方法中,存在很难以自由的定时来附加一部分的音 质的变化,从而不能够在声音中自由地附加逼真的表现力或丰富的音乐性 表现的问题
技术实现思路
本专利技术就是为了解决上述以往的问题,其目的在于,提供一种声音强 调装置,在讲话者或用户试图附加强调或者音乐表现的位置上,使所述"用 力"声音发生。以此,在用户的声音中附加由愤怒、兴奋、紧张、精力充 沛的说话方式表现的强调,或者附加演歌、布鲁斯歌曲或者摇滚乐等的音 乐表现,从而实现丰富的声音表现。并且,本专利技术的目的还在于,根据此声音的特征来推断讲话者或用户 的强调或者音乐表现的意图,针对所推断的讲话者或用户试图附加强调或 者音乐表现的声音区间,进行使其产生"用力"声音的处理。以此,提供 一种声音强调装置,在用户的声音中附加由愤怒、兴奋、紧张、精力充沛 的说话方式表现的强调,或者附加演歌、布鲁斯歌曲或者摇滚乐等的音乐 表现,从而实现丰富的声音表现。为了达到上述目的,本专利技术所涉及的声音强调装置包括强调发音区 间检测部,检测输入声音波形之中的强调区间,所述强调区间是指发出该 输入声音波形的发声者想要使声音波形发生变化的时间区间;以及声音强 调部,本文档来自技高网
...

【技术保护点】
一种声音强调装置,其特征在于,包括: 强调发音区间检测部,检测输入声音波形之中的强调区间,所述强调区间是指发出该输入声音波形的发声者想要使声音波形发生变化的时间区间;以及 声音强调部,使所述输入声音波形之中的、由所述强调发音区间 检测部检测出的所述强调区间所包含的声音波形的振幅包络的波动增加, 所述强调发音区间检测部,将所述输入声音波形的所述振幅波动的频率存在于10Hz以上且不足170Hz的预先规定了的范围内的状态,作为在声带上用了力的状态来检测,并将被检测出 在声带上用了力的状态的时间区间作为所述强调区间来检测。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:加藤弓子釜井孝浩星见昌克
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1