【技术实现步骤摘要】
本公开涉及将对于讲话语音的应答语音进行再现的语音再现方法、语音对话装置。
技术介绍
以往,提出了如下技术:在对话系统中,根据由呈阵列状配置的多个麦克风拾取的讲话者的讲话信号,来推定讲话者存在的方向,并将呈阵列状配置的多个扬声器的指向性朝向讲话者存在的方向再现应答语音。例如,专利文献1中公开了一种语音输入装置,具备:由排列的多个麦克风构成的麦克风阵列;由排列的多个扬声器构成的扬声器阵列;和基于与由麦克风阵列检测出的讲话者的方向相关的信息而将扬声器阵列的指向性朝向讲话者的方向的控制单元。另外,例如专利文献2中公开了一种指向性扩音装置,该装置在能够利用多个扬声器在不同的区域听取不同的信号源的声音的指向性扩音控制系统中,在预定的听取区域难以听到某个信号源的声音,或者为了在不同的听取区域听到各自分开的声音而将各自分开的声音信息传达到多个听取区域。在先技术文献专利文献1:日本特开2006-270876号公报专利文献2:日本特开2001-95082号公报
技术实现思路
但是,上述的以往的装置中,始终将指向性只朝向讲话者存在的方向
再现应答语音,因此有时语音对话系统会发生不良情况。例如有可能发生以下这样的不良情况:在想要听到(想要使其听到)应答语音的人没有进入指向性区域的情况下,该人没能听到应答语音;或者,在不想听到(不想使其听到)应答语音的人进入指向性区域的情况下,该人听到了应答语音。本公开的一技术方案涉及的语音再现方法,是语音对话系统中的语音再现方法,取得包含对所述语音对话系统讲话的讲话语音的、表示所述讲话语音的讲话者的周围的声音的周围语音信息,将所述周 ...
【技术保护点】
一种语音再现方法,是语音对话系统中的语音再现方法,取得周围语音信息,所述周围语音信息包含对所述语音对话系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音。
【技术特征摘要】
2015.04.24 JP 2015-089241;2016.01.19 JP 2016-008001.一种语音再现方法,是语音对话系统中的语音再现方法,取得周围语音信息,所述周围语音信息包含对所述语音对话系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音。2.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对所述讲话者具有指向性的再现方法,在所述第1语音信息的声级高于所述第2语音信息的声级的情况下,采用所述第1再现方法再现所述应答语音,在所述第1语音信息的声级低于所述第2语音信息的声级的情况下,采用所述第2再现方法再现所述应答语音。3.根据权利要求1所述的语音再现方法,对所述第1语音信息进行语音识别,使用所述语音识别的结果来生成应答语音,采用所述第1再现方法和所述第2再现方法中的某一方再现所述应答语音。4.根据权利要求1所述的语音再现方法,所述周围语音信息包含从含有多个麦克风的阵列麦克风系统取得的、在每个预定的角度具有指向性的多个周围语音信息,通过判断所述多个周围语音信息的各自是否为对所述语音对话系统的
\t所述讲话语音,而将所述周围语音信息分离为所述第1语音信息和所述第2语音信息。5.根据权利要求4所述的语音再现方法,在采用所述第2再现方法再现所述应答语音时,向所述多个周围语音信息中的、判断为是对所述语音对话系统的所述讲话语音的所述周围语音信息被取得的角度的方向,再现所述应答语音。6.根据权利要求4所述的语音再现方法,在所述多个周围语音信息的某一个包含预先存储的预定的关键字的情况下,判断为该包含预定的关键字的周围语音信息是对所述语音对话系统的讲话语音。7.根据权利要求1所述的语音再现方法,采用谱减法将所述周围语音信息分离为所述第1语音信息和所述第2语音信息。8.根据权利要求1所述的语音再现方法,根据所述周围语音信息来识别周围的人,基于将所述第1语音信息的声级和所述第2语音信息的声级比较的结果、以及识别所述周围的人的结果,切换采用所述第1再现方法和所述第2再现方法中的哪一方进行再现。9.根据权利要求1所述的语音再现方法,使用将过去取得的所述第1语音信息与在过去再现所述第1语音信息时所选择的所述第1再现方法和所述第2再现方法中的某一方相关联地存储的表格,选择再现所述应答语音的再现方法。10.根据权利要求2所述的语音再现方法,取得所述语音对话系统的周围的图像,根据所述图像来检测注视着所述语音对话系统的人,在采用所述第2再现方法再现所述应答语音时,向检测出的所述人再现所述应答语音。11.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对讲话者具有指向性的再现方法,取得所述语音对话系统的周围的图像,根据所述图像来检测注视着所述语音对话系统的人的数量,根据所述人的数量的检测结果来判断是否为多个人注视着所述语音对话系统,在判断为多个人注视着所述语音对话系统的情况下,采用所述第1再现方法再现所述应答语音,在判断为不是多个人注视着所述语音对话系统的情况下,采用所述第2再现方法再现所述应答语音。12.根据权利要求1所述的语音再现方法,所述第1再现方法是不具有指向性的再现方法,所述第2再现方法是对讲话者具有指向性的再现方法,通过所述讲话者持有的拾音装置拾取所述讲话语音,取得所述语音对话系统的周围的图像,根据所述图像来确定对所述拾音装置讲话的所述讲话者的位置,判断是否在由所述讲话者对所述拾音装置输入了预定的指示信号的状态下拾取到所述讲话语音,在判断为不是在所述预定的指示信号被输入了所述拾音装置的状态下拾取到所述讲话语音的情况下,采用所述第1再现方法再现所述应答语音,在判断为在所述预定的指示信号被输入了所述拾音装置的状态下拾取到所述讲话语音的情况下,采用所述第2再现方法再现所述应答语音。13.根据权利要求...
【专利技术属性】
技术研发人员:松冈智美,坂口敦,
申请(专利权)人:松下知识产权经营株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。