语音交互系统和方法、程序、学习模型生成装置和方法制造方法及图纸

技术编号:23485600 阅读:27 留言:0更新日期:2020-03-10 12:52
本发明专利技术涉及语音交互系统和方法、程序、学习模型生成装置和方法。提供一种能够适当地处理情况使得有效地防止发生响应错误的语音交互系统。话语获取单元获取用户话语。特征提取单元提取用户话语的特征。响应确定单元使用多个学习模型中的任何一个来确定与提取的特征向量相对应的响应。响应执行单元执行确定的响应。用户状态检测单元检测用户状态。学习模型选择单元根据检测到的用户状态从多个学习模型中选择学习模型。响应确定单元使用所选择的学习模型确定响应。

Speech interaction system and method, program, learning model generation device and method

【技术实现步骤摘要】
语音交互系统和方法、程序、学习模型生成装置和方法
本专利技术涉及语音交互系统、语音交互方法、程序、学习模型生成装置以及学习模型生成方法,并且尤其涉及用于通过使用语音与用户进行会话的语音交互系统、语音交互方法、程序、学习模型生成装置和学习模型生成方法。
技术介绍
使用户能够享受与语音交互机器人(语音交互系统)的日常会话的技术正变得普及。根据此技术的语音交互机器人分析用户发出的语音的语音信息,并根据分析结果进行响应。这里,语音交互机器人使用学习模型确定响应。关于上述技术,日本未经审查的专利申请公开No.2005-352154公开一种情绪状态反应操作装置,其根据用户发出的语音评估用户的情绪状态并执行适当的相应操作。根据日本未经审查的专利申请公开No.2005-352154的情绪状态反应操作装置包括:音素特征量提取装置,用于提取与语音信息的音素频谱相关的特征量;状态确定装置,用于输入音素特征量并基于预先准备的状态确定表确定语音信息的情绪状态;以及相应动作选择装置,用于输入情绪状态并基于预先准备的相应动作选择表确定相应的动作过程。根据日本未经审查的专利申请公开No.2005-352154的情绪状态反应运动装置还包括情绪状态学习表和情绪状态学习装置。情绪状态学习装置基于情绪状态学习表使用预定机器学习模型获取音素特征量和情绪状态之间的关系,并将学习结果存储在状态确定表中。状态确定装置基于状态确定表根据机器学习模型确定情绪状态。
技术实现思路
取决于用户的状态(用户的差异、用户的情绪等),机器学习模型可能不适合。在这种情况下,例如,可能发生诸如用户话语和装置话语之间的重叠的响应错误、或者用户话语和装置话语之间的时间段长的长沉默。为了解决此问题,根据日本未经审查的专利申请公开No.2005-352154的技术使用一个机器学习模型确定相应的动作过程。因此,利用根据日本未经审查的专利申请公开No.2005-352154的技术,难以适当地处理有效防止由不适当的学习模型引起的响应错误的情况。本公开涉及能够适当地处理情况使得有效地防止发生响应错误的语音交互系统、语音交互方法、程序、学习模型生成装置和学习模型生成方法。根据本公开的语音交互系统是通过使用语音与用户进行会话的语音交互系统,包括:话语获取单元,所述话语获取单元被配置成获取用户给出的用户话语;特征提取单元,所述特征提取单元被配置成至少提取所获取的用户话语的特征;响应确定单元,所述响应确定单元被配置成使用通过机器学习预先生成的多个学习模型中的任何一个根据所提取的特征来确定响应;响应执行单元,所述响应执行单元被配置成进行控制以便于执行所确定的响应;用户状态检测单元,所述用户状态检测单元被配置成检测用户状态,其是用户的状态;以及学习模型选择单元,所述学习模型选择单元被配置成根据检测到的用户状态从多个学习模型中选择学习模型,其中响应确定单元使用由学习模型选择单元选择的学习模型来确定响应。此外,根据本公开的语音交互方法是由语音交互系统执行的语音交互方法,该语音交互系统通过使用语音与用户进行会话,该语音交互方法包括:获取用户给出的用户话语;至少提取所获取的用户话语的特征;使用通过机器学习预先生成的多个学习模型中的任何一个根据所提取的特征来确定响应;进行控制以便于执行确定的响应;检测用户状态,该用户状态是用户的状态;根据检测到的用户状态从多个学习模型中选择学习模型,其中使用所选择的学习模型来确定响应。此外,根据本公开的程序是用于执行由语音交互系统执行的语音交互方法的程序,该语音交互系统通过使用语音与用户进行会话,该程序使计算机执行以下步骤:获取用户给出的用户话语;至少提取所获取的用户话语的特征;使用通过机器学习预先生成的多个学习模型中的任何一个根据所提取的特征来确定响应;进行控制以便于执行所确定的响应;检测用户状态,该用户状态是用户的状态;根据检测到的用户状态从多个学习模型中选择学习模型;以及使用所选择的学习模型来确定响应。用于生成响应错误的原因通常是不适合的学习模型。当学习模型不适合时,本公开的上述配置使其能够根据用户状态将学习模型切换到适合的学习模型。因此,本公开能够适当地处理情况,以便有效地防止发生响应错误。此外,优选地,用户状态检测单元将用户在会话中的积极性的程度检测为用户状态,并且学习模型选择单元选择与用户的积极性的程度相对应的学习模型。本公开的上述配置使其能够使用适合于用户在会话中的积极性的程度的学习模型进行会话,从而根据进行会话的用户的积极性而执行响应。此外,优选地,用户状态检测单元相对于语音交互系统已经输出语音作为响应的时间与用户在预定时段内已经发出语音的时间的总和检测用户在预定时间段内给出的语音量或者用户已经发出语音的时间百分比,并且学习模型选择单元选择对应用户给出的语音量或用户已经发出语音的时间的百分比的学习模型。本公开的上述配置使其能够更准确地确定用户的积极性的程度。此外,优选地,用户状态检测单元检测关于用户的识别信息作为用户状态,并且学习模型选择单元选择与关于用户的识别信息相对应的学习模型。本公开的上述配置使其能够使用适合于用户的学习模型进行会话,从而根据进行会话的用户而执行响应。此外,优选地,用户状态检测单元将用户的情绪检测为用户状态,并且学习模型选择单元选择与用户的情绪相对应的学习模型。本公开的上述配置使其能够使用适合于用户在会话中的情绪的程度的学习模型进行会话,从而根据进行会话的用户的情绪而做出响应。此外,优选地,用户状态检测单元将用户的健康状况检测为用户状态,并且学习模型选择单元选择与用户的健康状况相对应的学习模型。本公开的上述配置使其能够使用适合于用户的健康状况的程度的学习模型进行会话,从而根据进行会话的用户的健康状况而执行响应。此外,优选地,用户状态检测单元将用户的唤醒状态的程度检测为用户状态,并且学习模型选择单元选择与用户的唤醒状态的程度相对应的学习模型。本公开的上述配置使其能够使用适合于用户的唤醒状态的程度的学习模型进行会话,从而根据进行会话的用户的唤醒状态而做出响应。此外,根据本公开的学习模型生成装置是学习模型生成装置,该学习模型生成装置被配置成生成在通过使用语音与用户进行会话的语音交互系统中使用的学习模型,该装置包括:话语获取单元,所述话语获取单元被配置成通过与期望用户进行会话来获取用户话语,该用户话语是由一个或多个期望用户给出的话语;特征提取单元,所述特征提取单元被配置成提取至少指示所获取的用户话语的特征的特征向量;样本数据生成单元,所述样本数据生成单元被配置成生成样本数据,在所述样本数据中,指示对用户话语的响应的正确标签和特征向量彼此相关联;用户状态获取单元,所述用户状态获取单元被配置成获取用户状态,该用户状态是当用户已经发出话语时的期望用户的状态,以将所获取的用户状态与对应于用户话语的样本数据相关联;样本数据分类单元,所述样本数据分类单元被配置成针对用户状态中的每一个用户状态对样本数据进行分类;以及学习模型生成单元,所本文档来自技高网...

【技术保护点】
1.一种语音交互系统,所述语音交互系统通过使用语音与用户进行会话,所述语音交互系统包括:/n话语获取单元,所述话语获取单元被配置成获取由所述用户给出的用户话语;/n特征提取单元,所述特征提取单元被配置成至少提取所获取的用户话语的特征;/n响应确定单元,所述响应确定单元被配置成:使用通过机器学习而预先生成的多个学习模型中的任何一个,根据所提取的特征来确定响应;/n响应执行单元,所述响应执行单元被配置成进行控制以便于执行所确定的响应;/n用户状态检测单元,所述用户状态检测单元被配置成检测用户状态,所述用户状态是所述用户的状态;以及/n学习模型选择单元,所述学习模型选择单元被配置成根据所检测到的用户状态从所述多个学习模型中选择学习模型,/n其中,所述响应确定单元使用由所述学习模型选择单元选择的所述学习模型来确定所述响应。/n

【技术特征摘要】
20180831 JP 2018-1627741.一种语音交互系统,所述语音交互系统通过使用语音与用户进行会话,所述语音交互系统包括:
话语获取单元,所述话语获取单元被配置成获取由所述用户给出的用户话语;
特征提取单元,所述特征提取单元被配置成至少提取所获取的用户话语的特征;
响应确定单元,所述响应确定单元被配置成:使用通过机器学习而预先生成的多个学习模型中的任何一个,根据所提取的特征来确定响应;
响应执行单元,所述响应执行单元被配置成进行控制以便于执行所确定的响应;
用户状态检测单元,所述用户状态检测单元被配置成检测用户状态,所述用户状态是所述用户的状态;以及
学习模型选择单元,所述学习模型选择单元被配置成根据所检测到的用户状态从所述多个学习模型中选择学习模型,
其中,所述响应确定单元使用由所述学习模型选择单元选择的所述学习模型来确定所述响应。


2.根据权利要求1所述的语音交互系统,其中,
所述用户状态检测单元将所述用户在所述会话中的积极性的程度检测作为所述用户状态,以及
所述学习模型选择单元选择与所述用户的积极性的程度相对应的所述学习模型。


3.根据权利要求2所述的语音交互系统,其中,
所述用户状态检测单元检测所述用户在预定时段内给出的话语量,或者其中所述用户已经发出话语的时间相对于其中所述语音交互系统已经输出语音作为响应的时间和其中所述用户在所述预定时段内已经发出话语的时间的总和的百分比,以及
所述学习模型选择单元选择与所述用户给出的所述话语量或所述用户已经发出话语的时间的所述百分比相对应的所述学习模型。


4.根据权利要求1所述的语音交互系统,其中,
所述用户状态检测单元将关于所述用户的识别信息检测作为所述用户状态,以及
所述学习模型选择单元选择与关于所述用户的所述识别信息相对应的所述学习模型。


5.根据权利要求1所述的语音交互系统,其中,
所述用户状态检测单元将所述用户的情绪检测作为所述用户状态,以及
所述学习模型选择单元选择与所述用户的所述情绪相对应的所述学习模型。


6.根据权利要求1所述的语音交互系统,其中,
所述用户状态检测单元将所述用户的健康状况检测作为所述用户状态,以及
所述学习模型选择单元选择与所述用户的所述健康状况相对应的所述学习模型。


7.根据权利要求1所述的语音交互系统,其中,
所述用户状态检测单元将所述用户的唤醒状态的程度检测作为所述用户状态,以及
所述学习模型选择单元选择与所述用户的所述唤醒状态的程度相对应的所述学习模型。


8.一种由语音交互系统执行的语音交互方法,所述语音交互系统通过使用语音与用户进行会话,所述语音交互方法包括:
获取由所述用户给出...

【专利技术属性】
技术研发人员:河原达也堀达朗渡部生圣
申请(专利权)人:国立大学法人京都大学丰田自动车株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1