本发明专利技术涉及控制方法、语音交互装置、语音识别服务器、存储介质和控制系统。所述控制装置包括:计算单元,其被配置成控制包括话语区间检测器的语音交互装置,其被配置成通过设置的识别等级识别所获取的语音是否包括由对象者发出的话语,并且执行话语区间检测,其中,当从语音识别服务器中已经获取到指示对象者发出的话语很可能被包括在所获取的语音中的估计结果时,计算单元指令语音交互装置以使得降低话语区间检测器的识别等级的方式改变设置,并根据改变之后的识别等级通过话语区间检测与语音识别服务器执行通信。
【技术实现步骤摘要】
控制方法、语音交互装置、语音识别服务器、存储介质和控制系统
本公开涉及一种控制装置、语音交互装置、语音识别服务器和存储介质。
技术介绍
已知语音交互系统,其用于分析作为对话伙伴的对象者(用户)发出的话语,掌握话语的含义和内容,根据话语的类型生成响应,并且通过语音或文本将响应呈现给对象者。日本未经审查的专利申请特开No.2018-109663公开该语音交互系统中的技术,其中,包括对象者发出的话语在内的语音数据从本地侧发送到服务器侧,并且服务器侧执行语音识别并将语音识别的结果发回本地侧。
技术实现思路
为了在日本未审查专利申请特开No.2018-109663等中公开的语音交互系统中在服务器侧执行语音识别,需要在本地侧与服务器侧之间执行通信。当语音交互系统与处于诸如噪声很大的户外等环境中的对象者执行会话时,除了对象者发出的话语之外,大量的噪声也被收集。当收集到的语音数据不断地从本地发送到服务器端并且服务器端执行语音识别时,在对象者发出话语的情况下无意义的噪声被发送到服务器端,这导致通信成本和电力消耗被浪费地增加。考虑到上述情况,用于在本地侧上执行话语区间的检测、发送收集的语音当中的其中估计对象者正在讲话的区间中的语音数据、并且在服务器端上对上面的区间中的语音执行语音识别的相应技术的开发已正在进步。但是,因为检测话语区间的精度不够高,所以如果噪声音量大,则有可能无法成功地执行对象者发出的话语和噪声的识别。因此,当执行话语区间的检测并且将语音发送到服务器侧的时间段受到限制时,由对象者的发出的话语中的一些可能缺少发送到服务器侧的语音数据或全部对象者发出的话语可能被错误地识别为噪音,并且因此可能被发送到服务器端。考虑到这些情况,当执行话语区间的检测并且限制在其期间将语音发送到服务器侧的时间段时,这引起语音识别的准确性降低的问题。鉴于上述情况做出本公开,并且本公开旨在提供一种语音交互装置的控制装置、语音交互装置、语音识别服务器以及程序,其能够提高语音识别的准确性同时避免浪费地增加通信成本和电力消耗。根据本公开的一个实施例的控制装置包括:计算单元,该计算单元被配置成控制包括话语区间检测器的语音交互装置,该话语区间检测器被配置成通过设置的识别等级识别所获取的语音是否包括由对象者发出的话语,并且执行话语区间检测,其中,当从语音识别服务器中已经获取到指示对象者发出的话语很可能被包括在所获取的语音中的估计结果时,计算单元指令语音交互装置以使得降低话语区间检测器的识别等级的方式改变设置,并根据改变之后的识别等级通过话语区间检测与语音识别服务器执行通信。在对象者开始发出话语后,会话持续一段时间是正常的。即,当语音交互装置已经从语音识别服务器获取指示对象者发出的话语很可能被包括在获取的语音中的估计结果时,可以认为会话将继续一段时间。因此,如果当语音交互装置已经从语音识别服务器获取估计结果时将话语区间检测的识别等级设置为高,则有可能没有收集到对象者发出的话语。因此,当语音交互装置已经从语音识别服务器获取估计结果时,降低话语区间检测器的识别等级,以降低可能无法收集对象者发出的话语的可能性。根据此过程,可以提高语音识别服务器中语音识别的准确性。另一方面,当语音交互装置未从语音识别服务器获取估计结果时,话语区间检测器的识别等级的设置没有被改变。因此,可以在维持话语区间检测器中的原始识别等级的同时,防止话语区间检测继续进行,并且防止无意义的噪声被发送到语音识别服务器。因此,可以防止浪费地增加通信成本和电力消耗。此外,计算单元根据混合在所获取的语音中的噪声的程度来优选地确定通过其降低话语区间检测器的识别等级的程度。当在所获取的语音中混合的噪声的程度高时,难以在话语区间检测器中准确地执行话语区间检测。在这种情况下,当从语音识别服务器获取到指示对象者发出的话语很可能包括在所获取的语音中的估计结果时,使识别等级降低的程度相对较大。例如,将识别等级改变为不执行话语区间检测的最低等级,并且始终保持语音交互装置与语音识别服务器之间的通信连接。另一方面,当在所获取的语音中混合的噪声的程度低时,可以在话语区间检测器中准确地执行话语区间检测。在这种情况下,使识别等级的降低程度相对小,并且在防止通信成本和电力消耗增加的同时,可以降低未收集对象者发出的话语的可能性。此外,计算单元根据语音交互装置与对象者之间的距离来优选地确定通过其降低话语区间检测器的识别等级的程度。当语音交互装置与对象者之间的距离较大时,难以在话语区间检测器中准确地执行语音区间检测。在这种情况下,当已经从语音识别服务器获取指示对象者发出的话语很可能包括在所获取的语音中的估计结果时,使识别等级降低的程度相对大。例如,将识别等级改变为不执行话语区间检测的最低等级,并且语音交互装置与语音识别服务器之间的通信连接被恒定地保持。另一方面,当语音交互装置与对象者之间的距离小时,可以在话语区间检测器中准确地执行话语区间检测。在这种情况下,使降低识别等级的程度相对小,并且在防止通信成本和电力消耗增加的同时,可以降低未收集对象者发出的话语的可能性。此外,优选地,当在识别等级的设置已经改变之后的预定时间段内未从语音识别服务器获取到指示对象者发出的话语很可能包括在所获取的语音中的估计结果的指示时,计算单元优选地指令语音交互装置使识别等级返回到改变之前的识别等级。根据此过程,可以防止在对象者不发出话语时将无意义的噪声发送到语音识别服务器。因此,可以防止浪费地增加通信成本和电力消耗。根据本公开的一个实施例的语音交互装置包括:控制器,该控制器包括话语区间检测器,该话语区间检测器被配置成通过设置的识别等级来识别所获取的语音是否是对象者发出的话语并执行话语区间检测,其中,在控制器中,当从语音识别服务器已经获取到指示对象者发出的话语很可能被包括在所获取的语音中的估计结果时,语音交互装置以使得降低话语区间检测器的识别等级的这种方式改变设置,并根据改变后的识别等级通过话语区间检测执行与语音识别服务器的通信。因此,可以在防止浪费地增加通信成本和电力消耗的同时提高语音识别的准确性。根据本公开的一个实施例的语音识别服务器是被配置成对由包括话语区间检测器的语音交互装置通过通信发送的获取的语音执行语音识别的语音识别服务器,该话语区间检测器被配置成通过设置的识别等级来识别所获取的语音是否包括对象者发出的话语,并执行话语区间检测,其中语音交互装置包括控制器,并且当已经获取指示很有可能由对象者发出的话语被包括在获取的语音中的估计结果时,控制器指令语音交互装置以降低话语区间检测器的识别等级的方式改变设置,并且根据改变后的识别等级通过话语区间检测执行与语音识别服务器的通信。因此,可以在防止浪费地增加通信成本和电力消耗的同时提高语音识别的准确性。根据本公开的一个实施例的程序是用于使计算机执行用于控制包括话语区间检测器的语音交互装置的处理过程的程序,该话语区间检测器被配置成通过设置的识别等级识别所获取的语音是否包括由对象者发出的话语并执行话语区间检测,其中,该程序使计算机执行以下处理过程:当已经从语音本文档来自技高网...
【技术保护点】
1.一种用于控制控制系统的方法,所述控制系统用于控制包括话语区间检测器的语音交互装置,所述话语区间检测器被配置成通过设置的识别等级来识别被获取的语音是否包括对象者发出的话语并且执行话语区间检测,所述方法包括:/n当已经从语音识别服务器获取到指示出所述对象者发出的话语很有可能被包括在所述被获取的语音中的估计结果时,指令所述语音交互装置以使得降低所述话语区间检测器的所述识别等级的方式来改变设置,并且根据在所述改变之后的所述识别等级,通过所述话语区间检测来执行与所述语音识别服务器的通信。/n
【技术特征摘要】
20181220 JP 2018-2380931.一种用于控制控制系统的方法,所述控制系统用于控制包括话语区间检测器的语音交互装置,所述话语区间检测器被配置成通过设置的识别等级来识别被获取的语音是否包括对象者发出的话语并且执行话语区间检测,所述方法包括:
当已经从语音识别服务器获取到指示出所述对象者发出的话语很有可能被包括在所述被获取的语音中的估计结果时,指令所述语音交互装置以使得降低所述话语区间检测器的所述识别等级的方式来改变设置,并且根据在所述改变之后的所述识别等级,通过所述话语区间检测来执行与所述语音识别服务器的通信。
2.根据权利要求1所述的方法,进一步包括:
根据混合在所述被获取的语音中的噪声的程度,来确定所述话语区间检测器的所述识别等级被降低的程度。
3.根据权利要求1所述的方法,进一步包括:
根据所述语音交互装置与所述对象者之间的距离,来确定所述话语区间检测器的所述识别等级被降低的程度。
4.根据权利要求1至3中的任意一项所述的方法,进一步包括:
当在所述识别等级的所述设置已经被改变之后的预定时间段内尚未从所述语音识别服务器中获取到指示出所述对象者发出的话语很有可能被包括在所述被获取的语音中的估计结果时,指令所述语音交互装置将所述识别等级返回到在其被改变之前的所述识别等级。
5.一种语音交互装置,包括:
控制器,所述控制器包括话语区间检测器,所述话语区间检测器被配置成通过设置的识别等级来识别被获取的语音是否为对象者发出的话语并且执行话语区间检测,
其中,
在所述控制器中,当已经从语音识别服务器获取到指示出所述对象者发出的话语很有可能被包括在所述被获取的语音中的估计结果时,所述语音交互装置以使得降低所述话语区间检测器的所述识别等级的方式来改变设置,并且根据所述改变之后的所述识别等级,通过话语区间检测来执行与所述语...
【专利技术属性】
技术研发人员:渡部生圣,
申请(专利权)人:丰田自动车株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。