语音交互方法和语音交互设备技术

技术编号:17573776 阅读:84 留言:0更新日期:2018-03-28 21:09
在该语音交互方法中,获取表示发出的语音V0的语音信号,以及获取表示应答语音V2的应答信号,应答语音V2回应通过对所述语音信号进行语音识别而确定的发出的语音V0的内容。通过向语音再现单元提供所述应答信号来使应答语音V2再现,以及在从发出的语音V0的结束点tA开始直到应答语音V2再现的等待时段Q内,通过向语音再现单元提供表示感叹词语音V1的感叹词信号来再现感叹词语音V1。

【技术实现步骤摘要】
【国外来华专利技术】语音交互方法和语音交互设备
本专利技术涉及用于再现回应用户发音的语音的技术。
技术介绍
在语音交互
中,已知有一种技术,其通过再现表示对用户的发音的应答(例如对问题的应答)的语音,使得能够与用户进行语音交互。例如,专利文献1公开了一种配置,所述配置涉及通过执行语音识别来分析用户的说话语音的发出的内容的技术,并且在所公开的配置中,语音合成器基于分析的结果来输出应答语音。相关技术文献专利文献专利文献1:日本专利申请特许公开No.2012-128440
技术实现思路
在用户进行的发音和应答语音的回放之间,发生延迟。所述延迟对应于执行诸如语音识别等各种处理所需的时间。然而,出现了这一问题:当用户的发音的结束点和回放应答语音的开始点之间的无应答状态的时间长度相对长时,可能给用户带来机械和不自然的印象。鉴于这个问题,本专利技术的目的是实现自然的语音交互。为了解决上述问题,根据本专利技术的一个方面的语音交互方法包括:获取表示发出的语音的语音发音信号;获取表示应答语音的应答信号,所述应答语音回应通过对所述语音发音信号进行语音识别而确定的所述发出的语音的内容;向根据信号来播放语音的语音播放器提供所述应答信号,以使所述语音播放器播放所述应答语音;以及向所述语音播放器提供表示第一感叹词语音的第一感叹词信号,以使所述语音播放器在等待时段期间播放所述第一感叹词语音,所述等待时段从所述发出的语音的结束点开始并在开始回放所述应答语音时结束。通过该配置,将应答信号提供给语音播放器,使得回应所述发出的语音的内容而回放应答语音。另外,在等待时段期间播放感叹词语音,所述等待时段从所述发出的语音的结束点开始,并在开始回放所述应答语音时结束。因此,即使当应答语音的回放由于获取应答信号所需的语音识别处理等而相对于说话语音的结束点延迟时,也能够通过在等待时段期间插入感叹词语音来实现自然的语音交互。附图说明图1是示出根据本专利技术第一实施例的语音交互系统的框图。图2是示出根据第一实施例的语音交互设备的框图。图3是示出交互管理设备的框图。图4是示出回放感叹词语音和应答语音的说明图,所述应答语音回应发出的语音。图5是示出在根据第一实施例的语音交互设备中执行的操作的流程图。图6是示出回放应答语音的说明图,所述应答语音回应发出的语音。图7是示出回放感叹词语音和应答语音的说明图,所述应答语音回应发出的语音。图8是示出根据第二实施例的语音交互设备的框图。图9是回放多个感叹词语音的说明图,所述感叹词语音回应发出的语音。图10是根据第三实施例的语音交互设备的框图。图11是示出根据修改的语音交互设备的框图。图12是示出根据另一修改的语音交互设备的框图。图13是示出根据又一修改的语音交互设备的框图。具体实施方式第一实施例图1是示出根据本专利技术第一实施例的语音交互系统1的框图。如图1所示,第一实施例的语音交互系统1包括交互管理设备10和语音交互设备30。语音交互设备30是用于播放应答语音的设备,所述应答语音回应用户U的发音。语音交互设备30是例如由用户U携带的蜂窝电话或智能电话的便携式终端设备,或者是例如个人计算机的便携式或固定式终端设备。语音交互设备30经由通信网络200执行与交互管理设备10的通信,所述通信网络200包括移动通信网络、互联网等。如图1所示,语音交互设备30生成并播放表示应答的语音V2(以下称为“应答语音”),所述应答是回应由用户U发出的语音V0(以下称为“发出的语音”)而做出的。应答语音V2表示对问题的回答,或者表示当向其谈话或对其呼叫时做出的应答。图1示出了这一情形:其中,回应由发出的语音V0提出的问题“明天天气怎么样?”,语音交互设备30播放陈述了“将是晴天”的应答语音V2,。在等待时段期间的相对长的时间内没有做出应答的情况下,用户可能感觉到应答是机械的且不自然的,所述等待时段从发出的声音V0的结束点开始并在再现应答语音V2的开始点结束。因此,第一实施例的语音交互设备30在从发出的语音V0的结束点开始并在再现应答语音V2的开始点结束的时段(以下称为“等待时段”)期间播放感叹词的语音V1(以下称为“感叹词语音”)。图1例示了在应答语音V2之前播放暂定应答(犹豫标记)“um”的感叹词语音V1的情形。感叹词被归类为不具有词形变化的独立词汇。感叹词典型地独立于其他文字部分而被使用,并且通常由不是主语、谓语、修饰语或被修饰语的一部分的发音组成。更具体地说,感叹词应答可能包括:简单的应答,例如点头;表达犹豫(应答延迟)的词语或短语,例如日语中的“e-e-to”或“a-no”(英语中的“um”或“er”);表示应答(例如,对问题的肯定或否定确认)的词语或短语,例如“是”和“否”;表达说话者的感叹的词语或短语,例如日语中的“a-a”或“o-o”(“英语”中的“ah”或“woo”);或表达问候的词语或短语,例如“早上好”、“下午好”等。感叹词可以指的是感叹。感叹词语音V1也可以指的是与发出的语音V0和应答语音V2的内容无关的口头发音。应答语音V2的内容取决于发出的语音V0的内容,但是感叹词语音V1的内容通常不取决于发出的语音V0的内容。应答语音V2被认为是对发出的语音V0的必要应答。相对比的,感叹词语音V1被感觉为是与实质的语音交互无关的随机化应答,并且是在应答语音V2之前补充地(辅助地)或额外地发出的。感叹词语音V1可以指的是不作为应答语音V2的一部分的语音。图2是示出第一实施例的语音交互设备30的框图。如图2所示,第一实施例的语音交互设备30包括语音输入单元31、存储单元32、控制器33、语音播放器34和通信单元35。语音输入单元31是生成语音信号(以下称为“语音发音信号”)X的元件,所述语音信号X表示例如用户U的发出的语音V0。语音输入单元31包括语音接收器312和模数转换器314。语音接收器312接收由用户U发出的发出的语音V0。语音接收器312生成表示发出的语音V0的时间波形的模拟语音信号。模数转换器314将由语音接收器312生成的语音信号转换成数字的语音发音信号X。语音播放器34根据提供给该语音播放器34的语音信号(应答信号Y和语音信号Z)来播放语音。第一实施例的语音播放器34包括数模转换器342和声音输出器344。数模转换器342将模拟语音信号转换为数字语音信号。声音输出器344(例如,扬声器或耳机)根据转换的语音信号来播放语音。通信单元35是用于经由通信网络200执行与交互管理设备10通信的通信设备。要注意的是,语音交互设备30和通信网络200之间的通信可以经由有线或无线连接进行。存储单元32是例如非暂时性记录介质。存储单元32可以包括:半导体记录介质,例如随机存取存储器(RAM)或只读存储器(ROM);光学记录介质,例如光盘只读存储器(CD-ROM);以及以自由选择形式的已知记录介质,例如磁性记录介质;或多种类型的不同记录介质的组合。要注意的是,在本说明书中,“非暂时性”记录介质包括除暂时传播信号之外的所有类型的计算机可读记录介质,并且不排除易失性记录介质。存储单元32存储由控制器33执行的程序和由控制器33使用的各种类型的数据。在第一实施例中,预先记录表示由特定说话者发出的特定内容的感叹词语音V1的语音信号Z(以下称为“感叹词信号”)。随后,将记本文档来自技高网...
语音交互方法和语音交互设备

【技术保护点】
一种语音交互方法,包括:获取表示发出的语音的语音发音信号;获取表示应答语音的应答信号,所述应答语音回应通过对所述语音发音信号进行语音识别而确定的所述发出的语音的内容;向根据信号来播放语音的语音播放器提供所述应答信号,以使所述语音播放器播放所述应答语音;以及向所述语音播放器提供表示第一感叹词语音的第一感叹词信号,以使所述语音播放器在等待时段期间播放所述第一感叹词语音,所述等待时段从所述发出的语音的结束点开始并在开始回放所述应答语音时结束。

【技术特征摘要】
【国外来华专利技术】2015.07.09 JP 2015-1375061.一种语音交互方法,包括:获取表示发出的语音的语音发音信号;获取表示应答语音的应答信号,所述应答语音回应通过对所述语音发音信号进行语音识别而确定的所述发出的语音的内容;向根据信号来播放语音的语音播放器提供所述应答信号,以使所述语音播放器播放所述应答语音;以及向所述语音播放器提供表示第一感叹词语音的第一感叹词信号,以使所述语音播放器在等待时段期间播放所述第一感叹词语音,所述等待时段从所述发出的语音的结束点开始并在开始回放所述应答语音时结束。2.根据权利要求1所述的语音交互方法,其中,当在所述等待时段中从所述发出的语音的所述结束点起的经过时间超过阈值时,由所述语音播放器播放所述第一感叹词语音。3.根据权利要求1或2所述的语音交互方法,还包括:在将所述第一感叹词信号提供给所述语音播放器以使所述语音播放器播放所述第一感叹词语音之后,所述等待时段还在继续的情况下,向所述语音播放器提供表示第二感叹词语音的第二感叹词信号。4.根据权利要求3所述的语音交互方法,其中,所述第一感叹词不同于所述第二感叹词。5.根据权利要求3或4所述的语音交互方法,其中,从发出的语音的所述结束点到回放所述第一感叹词语音的开始点的时段不同于从回放所述第一感叹词语音的结束点到回放所述第二感叹词语音的开始点的时段。6.根据权利要求3至5中任一项所述的语音交互方法,还包括:在将所述第二感叹词信号提供给所述语音播放器以使所述语音播...

【专利技术属性】
技术研发人员:嘉山启松原弘明
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1