语音合成设备、语音合成方法及其程序技术

技术编号:14736612 阅读:78 留言:0更新日期:2017-03-01 09:39
响应于用户提出的问题而对自然答复进行语音合成。一种语音合成设备包括:语音输入器102,其被配置为输入语音;获取器22,其被配置为获得对语音输入器102输入的语音的首答复;分析器112,其被配置为分析该首次答复是否包括重复目标;以及语音合成器24,其被配置为在所分析的首次答复被确定为包括重复目标的情况下,根据包括重复至少两次的重复目标的二次答复来合成语音以输出语音。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种语音合成设备、一种语音合成方法及其程序。
技术介绍
在近来已提出的各种语音合成技术当中,包括了以下示例:一种用于合成并输出与用户的话音音调或发音特质相对应的语音的技术,其目的是为了使得所得到的语音更加像人的声音(例如,参考专利文献1);以及一种用于分析用户的语音并从而诊断用户的心理或身体状态的技术(例如,参考专利文献2)。也提出了一种交互式语音系统,其用于识别用户输入的语音,并且用于对场景指定的内容进行语音合成和输出以使得能够与用户进行语音交互(例如,参考专利文献3)。相关技术文献专利文献专利文献1:日本专利申请公开公布第2003-271194号专利文献2:日本专利第4495907号专利文献3:日本专利第4832097号
技术实现思路
本专利技术要解决的问题当对所述的语音合成技术和交互式语音系统进行结合时,可以设想如下的一种语音合成设备:其响应于用户的语音而搜索数据并对输出语音进行合成。已就这种语音合成设备而指出的一个缺点在于,所输出的合成语音被用户感知为非常不自然;更具体地,所输出的语音听起来就像机器在说话。鉴于这些状况,本专利技术的目的在于提供能够产生用户能够感知为自然声音的语音的语音合成设备、语音合成方法及其程序。解决问题的手段为了实现所述目的,根据本专利技术的一方面的语音合成设备包括:语音输入器,其被配置为输入语音;获取器,其被配置为获得对语音输入器输入的语音的首次答复;分析器,其被配置为分析该首次答复是否包括重复目标;以及语音合成器,其被配置为在所分析的首次答复被确定为包括重复目标的情况下,根据包括重复了至少两次的重复目标的二次答复来合成语音以输出语音。在根据本专利技术的一方面所述的语音合成设备中,当首次答复包括重复目标时,重复该重复目标并且根据所重复的重复目标来合成语音以将其输出。因此,所输出的语音被用户感知为自然声音,达到了给用户留下他们正与人类进行交谈的印象的程度。在根据本专利技术的一方面所述的语音合成设备中,重复目标可以是具有2个以下音节的感叹词,并且分析器可以确定首次答复是否包括感叹词,并且在确定首次答复包括感叹词的情况下,分析器可以分析感叹词中的音节数量是否为2个以下。在根据本专利技术的一方面的语音合成设备中,获取器可以包括:语言分析器,其被配置为分析语音输入器输入的语音的含义;以及首次答复生成器,其被配置为生成对语言分析器分析的含义做出回应的首次答复。通过该配置,对针对输入语音的适当答复进行语音合成和输出。根据本专利技术的一方面的语音合成设备还可以包括:重复器,其被配置为在确定首次答复包括重复目标的情况下,重复该目标至少两次,并且输出所重复的目标。通过该配置,语音合成设备可以对用户给出用户正与人谈话的印象,其中,包括重音,并且尝试与用户建立友好关系。在语音合成设备包括重复器的配置中,语音合成器可以进行如下操作:在首次答复中所包括的感叹词中的音节数量为2个以下的情况下,根据包括有已通过重复器进行重复的感叹词的二次答复来对语音进行合成;并且在首次答复中所包括的感叹词中的音节数量为3个以上的情况下,将首次答复当作二次答复并且根据二次答复对语音进行合成。当首次答复中所包括的感叹词的音节数量为2个以下时,在二次答复中重复感叹词并且根据二次答复对语音进行合成。当首次答复中所包括的感叹词中的音节数量为3个以上时,将首次答复当作二次答复并且根据二次答复对语音进行合成。语音合成器可以包括:语音序列生成器,其被配置为根据答复来生成语音序列;以及合成器,其被配置为输出基于语音序列而合成的语音信号。根据本专利技术的一方面的语音合成设备可以在第一模式下或在第二模式下进行操作。在第一模式下,首次答复生成器可以被配置为生成包括有感叹词和特定内容的首次答复;而在第二模式下,首次答复生成器被配置为生成仅包括感叹词或仅包括特定内容的首次答复。在第一模式下,生成包括感叹词和特定内容的二次答复,并且当感叹词中的音节的数量为2个以下时,重复感叹词。以该方式,可以与用户建立更好的友好关系。根据本专利技术的一方面的语音合成设备可以在禁止模式下进行操作。在禁止模式下,语音合成器可以在不重复具有2个以下的音节的感叹词的情况下对语音进行合成。其原因是,取决于不同的语境,仅仅对感叹词的重复偶尔可能使得用户感到不适。禁止模式的使用使得能够降低引起用户不适的风险。在该配置中,在禁止模式下,重复器可以被配置为取消重复具有2个以下音节的感叹词的功能。除了语音合成设备外,本专利技术可以被理解为包括语音合成方法、使得计算机起到语音合成的作用的程序以及其上存储有该程序的计算机可读存储介质。附图说明图1是示出根据第一实施例的语音合成设备的配置的图。图2是示出语音合成设备的功能配置的框图。图3是示出根据第一实施例的语音合成设备的操作的流程图。图4A是示出用户提出的示例问题的图。图4B是示出语音合成设备合成的示例答复的图。图5A是示出用户提出的示例问题的图。图5B是示出语音合成设备合成的示例答复的图。图6是示出根据第二实施例的语音合成设备的配置的图。图7是示出根据第二实施例的语音合成设备的操作的流程图。图8是示出语音合成设备合成的示例答复的图。图9是示出语音合成设备合成的示例答复的图。具体实施方式首先将描述根据实施例的语音合成设备的概述。假设在人们进行对话期间,一个人(人“a”)问了问题并且另一人(人“b”)对这些问题做出回应。在这样的状况中,当人“a”提出问题并且人“b”对该问题做出回应时,人“b”有时重复一部分或全部答复而不是仅仅按原样提供答复。例如,在日文中,当人“a”问了问题并且人“b”打算提供肯定答复[ha-i](这里,应注意,声音以罗马字母示出并按音节划分。以下,由方括号“[]”括起的语句按音节划分,并且该形式也可应用于附图中。)时,人“b”有时重复该答复,并因而做出[ha-i-ha-i]的答复,而不是仅仅做出[ha-i]的答复。也存在人“b”不重复对人“a”提出的问题的答复的情况。例如,当人“a”问了问题并且人“b”打算以日文[i-i-e]提供否定答复时,人“b”几乎不会如以[i-i-e-i-i-e]那样通过重复[i-i-e]进行答复。尽管事实上可能不存在答复的语义变化,但是取决于对象语言,答复与重复之间的关系可能是相反的。例如,当人“b”以英文“yes(是)”提供肯定答复时,人“b”几乎不会通过如以“yes,yes(是、是)”那样重复“yes(是)”来进行答复。另一方面,当人“b”以英文“no(不)”提供否定答复时,人“b”有时会通过如以“no,no(否、否)”那样重复“no(否)”来进行答复。在另一种情况下,当人“a”用日文“asuwahare?”(翻译为英文是“Willbesunnytomorrow(明天是晴天吗)?”)问了问题,并且人“b”打算用日文提供答复[ha-iha-re-de-su](英文的语义内容为“Yes,itwillbesunny(是,将是晴天)”)时,人“b”有时会通过如以[ha-i-ha-iha-re-de-su]那样重复[ha-i]来进行答复。然而,当人“b”以英文“Yes,itwillbesunnytomorrow(是的,明天将是晴天)”用相同的语义内容来进行答复时,人“b”几乎不会通过如以“Yes,yes,itwill本文档来自技高网...
语音合成设备、语音合成方法及其程序

【技术保护点】
一种语音合成设备,包括:语音输入器,其被配置为输入语音;获取器,其被配置为获得对所述语音输入器输入的语音的首次答复;分析器,其被配置为分析所述首次答复是否包括重复目标;以及语音合成器,其被配置为在所分析的首次答复被确定为包括所述重复目标的情况下,根据包括重复至少两次的所述重复目标的二次答复来合成语音以输出所述语音。

【技术特征摘要】
【国外来华专利技术】2014.07.02 JP 2014-1368121.一种语音合成设备,包括:语音输入器,其被配置为输入语音;获取器,其被配置为获得对所述语音输入器输入的语音的首次答复;分析器,其被配置为分析所述首次答复是否包括重复目标;以及语音合成器,其被配置为在所分析的首次答复被确定为包括所述重复目标的情况下,根据包括重复至少两次的所述重复目标的二次答复来合成语音以输出所述语音。2.根据权利要求1所述的语音合成设备,其中,所述重复目标是具有2个以下音节的感叹词,其中,所述分析器被配置为:确定所述首次答复是否包括感叹词;以及在确定所述首次答复包括感叹词的情况下,分析所述感叹词中的音节数量是否为2个以下。3.根据权利要求2所述的语音合成设备,其中,所述获取器包括:语言分析器,其被配置为分析所述语音输入器输入的语音的含义;以及首次答复生成器,其被配置为生成对所述语言分析器分析的含义做出回应的首次答复。4.根据权利要求2或3所述的语音合成设备,还包括:重复器,其被配置为在所述分析器确定所述首次答复中所包括的感叹词中的音节数量为2个以下的情况下,重复所述感叹词至少两次,并且输出所重复的感叹词。5.根据权利要求4所述的语音合成设备,其中,所述语音合成器被配置为:在所述首次答复中所包括的感叹词中的音节数量为2个以下的情况下,根据包括有已通过所述重复器进行重复的感叹词的所述二次答复来对语音进行合成;以及在所述首次答复中所包括的感叹词中的音节数量为3个以上的情况下,将所述首次答复当作所述二次答复并且根据该二次...

【专利技术属性】
技术研发人员:松原弘明
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1