语音再现方法、语音对话装置制造方法及图纸

技术编号:13952986 阅读:48 留言:0更新日期:2016-11-02 08:25
本发明专利技术涉及语音再现方法、语音对话装置。本公开提供能够采用与讲话者的周围的状况相应的再现方法再现应答语音的语音再现方法、语音对话装置和语音对话程序。语音再现方法包括:取得包含对语音对话系统讲话的讲话语音的、表示讲话语音的讲话者的周围的声音的周围语音信息的步骤(S301);将周围语音信息分离为包含讲话语音的第1语音信息和包含除了讲话语音以外的声音的第2语音信息的步骤(S302);将第1语音信息的声级和第2语音信息的声级进行比较的步骤(S303);以及根据比较的结果,采用第1再现方法和再现的语音的指向性与第1再现方法不同的第2再现方法的某一方再现应答语音的步骤(S304、S305)。

【技术实现步骤摘要】

本公开涉及将对于讲话语音的应答语音进行再现的语音再现方法、语音对话装置
技术介绍
以往,提出了如下技术:在对话系统中,根据由呈阵列状配置的多个麦克风拾取的讲话者的讲话信号,来推定讲话者存在的方向,并将呈阵列状配置的多个扬声器的指向性朝向讲话者存在的方向再现应答语音。例如,专利文献1中公开了一种语音输入装置,具备:由排列的多个麦克风构成的麦克风阵列;由排列的多个扬声器构成的扬声器阵列;和基于与由麦克风阵列检测出的讲话者的方向相关的信息而将扬声器阵列的指向性朝向讲话者的方向的控制单元。另外,例如专利文献2中公开了一种指向性扩音装置,该装置在能够利用多个扬声器在不同的区域听取不同的信号源的声音的指向性扩音控制系统中,在预定的听取区域难以听到某个信号源的声音,或者为了在不同的听取区域听到各自分开的声音而将各自分开的声音信息传达到多个听取区域。在先技术文献专利文献1:日本特开2006-270876号公报专利文献2:日本特开2001-95082号公报
技术实现思路
但是,上述的以往的装置中,始终将指向性只朝向讲话者存在的方向
再现应答语音,因此有时语音对话系统会发生不良情况。例如有可能发生以下这样的不良情况:在想要听到(想要使其听到)应答语音的人没有进入指向性区域的情况下,该人没能听到应答语音;或者,在不想听到(不想使其听到)应答语音的人进入指向性区域的情况下,该人听到了应答语音。本公开的一技术方案涉及的语音再现方法,是语音对话系统中的语音再现方法,取得包含对所述语音对话系统讲话的讲话语音的、表示所述讲话语音的讲话者的周围的声音的周围语音信息,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法和再现的声音的指向性与所述第1再现方法不同的第2再现方法中的某一方再现对所述讲话语音的应答语音。根据本公开,能够采用与讲话者的周围的状况相应的再现方法再现应答语音。附图说明图1是表示本公开的实施方式中的语音对话装置的构成的图。图2是表示本公开的实施方式中的控制部的功能构成的图。图3是表示本实施方式中的语音对话装置的工作的一例的流程图。图4是表示本实施方式中的语音对话系统的构成的图。图5是用于说明本实施方式中的语音对话系统的工作的顺序图。图6是用于说明对语音对话装置讲话的讲话者的讲话语音的声级高于除了讲话语音以外的声音的声级的情况下的应答语音的第1再现方法的示意图。图7是用于说明对语音对话装置讲话的讲话者的讲话语音的声级低于除了讲话语音以外的声音的声级的情况下的应答语音的第2再现方法的示
意图。图8是表示本实施方式的变形例4中的语音对话装置的工作的一例的流程图。图9是表示本实施方式的变形例6中的语音对话系统的工作的一例的流程图。图10是表示本实施方式的变形例7中的语音对话装置的工作的一例的流程图。图11是表示本实施方式的变形例8中的语音对话装置的工作的一例的流程图。图12是表示本实施方式的变形例9中的语音对话装置的工作的一例的流程图。图13是表示本实施方式的变形例10中的语音对话装置的工作的一例的流程图。图14是表示本实施方式的变形例11中的语音对话装置的工作的一例的流程图。图15是表示本实施方式的变形例12中的语音对话装置的工作的一例的流程图。附图标记说明100 语音对话装置101 语音取得部102 通信部103 显示部104 控制部105 再现部106 图像取得部107 声音信息DB110 服务器装置111 控制部112 通信部113 声音信息DB201 声音信息取得部202 分析部203 判断部204 通常再现控制部205 区域再现控制部206 再现控制部具体实施方式(成为本公开的基础的见解)考虑到:一般来说,在通过讲话者对语音对话系统发出语音指令来控制设备时,是在混入了周围的噪音或除了对语音对话系统讲话的讲话者以外的讲话者的语音的噪音环境下使用语音对话系统。因此,正在研究:通过使来自语音对话系统的应答语音具有指向性,从而仅向正在与语音对话系统对话的人再现应答语音。例如,在语音对话系统前存在多个人,想要听到对于讲话语音的应答语音的人只有讲话者一人的情况下,如果采用不具有指向性的通常的再现方法再现应答语音,则有时由于周围的杂音等噪音导致讲话者难以听到应答语音,或原本不想被其听到的人听到了应答语音。因此,例如专利文献1所公开的技术那样,将扬声器的指向性只朝向特定的人的方向再现应答语音是有效的。但是,如果使用专利文献1所公开的装置,则有可能产生下述问题。例如存在这样的问题:在语音对话系统前存在多个人,其所有人想要听到对于讲话语音的应答语音的情况下,如果像专利文献1那样将指向性只朝向讲话的特定的人的位置再现应答语音,则想要听到应答语音的除了讲话者以外的人无法听到应答语音。即,专利文献1的装置无法根据讲话者的周围的状况而采用最佳的再现方法再现应答语音。另外,专利文献2的装置也同样没有对根据讲话者的周围的状况而采用最佳的再现方法再现应答语音进行研究。为解决上述那样的问题,本公开的一技术方案涉及的语音再现方法,是语音对话系统中的语音再现方法,取得包含对所述语音对话系统讲话的讲话语音的、表示所述讲话语音的讲话者的周围的声音的周围语音信息,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方再现对所述讲话语音的应答语音。根据该构成,取得包含对语音对话系统讲话的讲话语音的、表示讲话语音的讲话者的周围的声音的周围语音信息。周围语音信息被分离为包含讲话语音的第1语音信息和包含除了讲话语音以外的声音的第2语音信息。将第1语音信息的声级和第2语音信息的声级进行比较。根据比较的结果,采用第1再现方法和再现的语音的指向性与第1再现方法不同的第2再现方法中的某一方再现对于讲话语音的应答语音。因此,根据包含对语音对话系统讲话的讲话语音的第1语音信息的声级、与包含除了讲话语音以外的声音的第2语音信息的声级的比较结果,采用第1再现方法和再现的语音的指向性与第1再现方法不同的第2再现方法中的某一方再现应答语音,所以能够采用与讲话者的周围的状况相应的再现方法再现应答语音。另外,上述的语音再现方法中,可以设置成:所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对所述讲话者具有指向性的再现方法,在所述第1语音信息的声级高于所述第2语音信息的声级的情况下,采用所述第1再现方法再现所述应答语音,在所述第1语音信息的声级低于所述第2语音信息的声级的情况下,采用所述第2再现方法再现
所述应答语音。根据该构成,第1再现方法是不具有指向性的再现方法,第2再现方法是对讲话者具有指向性的再现方法。在第1语音信息的声级高于第2语音信息的声级的情况下,采用第1再现方法再现应答语音,在第1语音信息的声级低于第2语音信息的声级的情况下,采用第2再现方法再现应答本文档来自技高网
...

【技术保护点】
一种语音再现方法,是语音对话系统中的语音再现方法,取得周围语音信息,所述周围语音信息包含对所述语音对话系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音。

【技术特征摘要】
2015.04.24 JP 2015-089241;2016.01.19 JP 2016-008001.一种语音再现方法,是语音对话系统中的语音再现方法,取得周围语音信息,所述周围语音信息包含对所述语音对话系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音。2.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对所述讲话者具有指向性的再现方法,在所述第1语音信息的声级高于所述第2语音信息的声级的情况下,采用所述第1再现方法再现所述应答语音,在所述第1语音信息的声级低于所述第2语音信息的声级的情况下,采用所述第2再现方法再现所述应答语音。3.根据权利要求1所述的语音再现方法,对所述第1语音信息进行语音识别,使用所述语音识别的结果来生成应答语音,采用所述第1再现方法和所述第2再现方法中的某一方再现所述应答语音。4.根据权利要求1所述的语音再现方法,所述周围语音信息包含从含有多个麦克风的阵列麦克风系统取得的、在每个预定的角度具有指向性的多个周围语音信息,通过判断所述多个周围语音信息的各自是否为对所述语音对话系统的
\t所述讲话语音,而将所述周围语音信息分离为所述第1语音信息和所述第2语音信息。5.根据权利要求4所述的语音再现方法,在采用所述第2再现方法再现所述应答语音时,向所述多个周围语音信息中的、判断为是对所述语音对话系统的所述讲话语音的所述周围语音信息被取得的角度的方向,再现所述应答语音。6.根据权利要求4所述的语音再现方法,在所述多个周围语音信息的某一个包含预先存储的预定的关键字的情况下,判断为该包含预定的关键字的周围语音信息是对所述语音对话系统的讲话语音。7.根据权利要求1所述的语音再现方法,采用谱减法将所述周围语音信息分离为所述第1语音信息和所述第2语音信息。8.根据权利要求1所述的语音再现方法,根据所述周围语音信息来识别周围的人,基于将所述第1语音信息的声级和所述第2语音信息的声级比较的结果、以及识别所述周围的人的结果,切换采用所述第1再现方法和所述第2再现方法中的哪一方进行再现。9.根据权利要求1所述的语音再现方法,使用将过去取得的所述第1语音信息与在过去再现所述第1语音信息时所选择的所述第1再现方法和所述第2再现方法中的某一方相关联地存储的表格,选择再现所述应答语音的再现方法。10.根据权利要求2所述的语音再现方法,取得所述语音对话系统的周围的图像,根据所述图像来检测注视着所述语音对话系统的人,在采用所述第2再现方法再现所述应答语音时,向检测出的所述人再现所述应答语音。11.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对讲话者具有指向性的再现方法,取得所述语音对话系统的周围的图像,根据所述图像来检测注视着所述语音对话系统的人的数量,根据所述人的数量的检测结果来判断是否为多个人注视着所述语音对话系统,在判断为多个人注视着所述语音对话系统的情况下,采用所述第1再现方法再现所述应答语音,在判断为不是多个人注视着所述语音对话系统的情况下,采用所述第2再现方法再现所述应答语音。12.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对讲话者具有指向性的再现方法,通过所述讲话者持有的拾音装置拾取所述讲话语音,取得所述语音对话系统的周围的图像,根据所述图像来确定对所述拾音装置讲话的所述讲话者的位置,判断是否在由所述讲话者对所述拾音装置输入了预定的指示信号的状态下拾取到所述讲话语音,在判断为不是在所述预定的指示信号被输入了所述拾音装置的状态下拾取到所述讲话语音的情况下,采用所述第1再现方法再现所述应答语音,在判断为在所述预定的指示信号被输入了所述拾音装置的状态下拾取到所述讲话语音的情况下,采用所述第2再现方法再现所述应答语音。13.根据权利要求...

【专利技术属性】
技术研发人员:松冈智美坂口敦
申请(专利权)人:松下知识产权经营株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1