语音交互系统和方法、程序、学习模型生成装置和方法制造方法及图纸

技术编号：23485600 阅读：27 留言：0更新日期：2020-03-10 12:52

本发明专利技术涉及语音交互系统和方法、程序、学习模型生成装置和方法。提供一种能够适当地处理情况使得有效地防止发生响应错误的语音交互系统。话语获取单元获取用户话语。特征提取单元提取用户话语的特征。响应确定单元使用多个学习模型中的任何一个来确定与提取的特征向量相对应的响应。响应执行单元执行确定的响应。用户状态检测单元检测用户状态。学习模型选择单元根据检测到的用户状态从多个学习模型中选择学习模型。响应确定单元使用所选择的学习模型确定响应。

Speech interaction system and method, program, learning model generation device and method

全部详细技术资料下载

【技术实现步骤摘要】
语音交互系统和方法、程序、学习模型生成装置和方法
本专利技术涉及语音交互系统、语音交互方法、程序、学习模型生成装置以及学习模型生成方法，并且尤其涉及用于通过使用语音与用户进行会话的语音交互系统、语音交互方法、程序、学习模型生成装置和学习模型生成方法。
技术介绍
使用户能够享受与语音交互机器人(语音交互系统)的日常会话的技术正变得普及。根据此技术的语音交互机器人分析用户发出的语音的语音信息，并根据分析结果进行响应。这里，语音交互机器人使用学习模型确定响应。关于上述技术，日本未经审查的专利申请公开No.2005-352154公开一种情绪状态反应操作装置，其根据用户发出的语音评估用户的情绪状态并执行适当的相应操作。根据日本未经审查的专利申请公开No.2005-352154的情绪状态反应操作装置包括：音素特征量提取装置，用于提取与语音信息的音素频谱相关的特征量；状态确定装置，用于输入音素特征量并基于预先准备的状态确定表确定语音信息的情绪状态；以及相应动作选择装置，用于输入情绪状态并基于预先准备的相应动作选择表确定相应的动作过程。根据日本未经审查的专利申请公开No.2005-352154的情绪状态反应运动装置还包括情绪状态学习表和情绪状态学习装置。情绪状态学习装置基于情绪状态学习表使用预定机器学习模型获取音素特征量和情绪状态之间的关系，并将学习结果存储在状态确定表中。状态确定装置基于状态确定表根据机器学习模型确定情绪状态。
技术实现思路
取决于用户的状态(用户的差异、用户的情绪等)，机器学习模型可能...

【技术保护点】
1.一种语音交互系统，所述语音交互系统通过使用语音与用户进行会话，所述语音交互系统包括：/n话语获取单元，所述话语获取单元被配置成获取由所述用户给出的用户话语；/n特征提取单元，所述特征提取单元被配置成至少提取所获取的用户话语的特征；/n响应确定单元，所述响应确定单元被配置成：使用通过机器学习而预先生成的多个学习模型中的任何一个，根据所提取的特征来确定响应；/n响应执行单元，所述响应执行单元被配置成进行控制以便于执行所确定的响应；/n用户状态检测单元，所述用户状态检测单元被配置成检测用户状态，所述用户状态是所述用户的状态；以及/n学习模型选择单元，所述学习模型选择单元被配置成根据所检测到的用户状态从所述多个学习模型中选择学习模型，/n其中，所述响应确定单元使用由所述学习模型选择单元选择的所述学习模型来确定所述响应。/n

【技术特征摘要】
20180831 JP 2018-1627741.一种语音交互系统，所述语音交互系统通过使用语音与用户进行会话，所述语音交互系统包括：
话语获取单元，所述话语获取单元被配置成获取由所述用户给出的用户话语；
特征提取单元，所述特征提取单元被配置成至少提取所获取的用户话语的特征；
响应确定单元，所述响应确定单元被配置成：使用通过机器学习而预先生成的多个学习模型中的任何一个，根据所提取的特征来确定响应；
响应执行单元，所述响应执行单元被配置成进行控制以便于执行所确定的响应；
用户状态检测单元，所述用户状态检测单元被配置成检测用户状态，所述用户状态是所述用户的状态；以及
学习模型选择单元，所述学习模型选择单元被配置成根据所检测到的用户状态从所述多个学习模型中选择学习模型，
其中，所述响应确定单元使用由所述学习模型选择单元选择的所述学习模型来确定所述响应。

2.根据权利要求1所述的语音交互系统，其中，
所述用户状态检测单元将所述用户在所述会话中的积极性的程度检测作为所述用户状态，以及
所述学习模型选择单元选择与所述用户的积极性的程度相对应的所述学习模型。

3.根据权利要求2所述的语音交互系统，其中，
所述用户状态检测单元检测所述用户在预定时段内给出的话语量，或者其中所述用户已经发出话语的时间相对于其中所述语音交互系统已经输出语音作为响应的时间和其中所述用户在所述预定时段内已经发出话语的时间的总和的百分比，以及
所述学习模型选择单元选择与所述用户给出的所述话语量或所述用户已经发出话语的时间的所述百分比相对应的所述学习模型。

4.根据权利要求1所述的语音交互系统，其中，
所述用户状态检测单元将关于所述用户的识别信息检测作为所述用户状态，以及
所述学习模型选择单元选择与关于所述用户的所述识别信息相对应的所述学习模型。

5.根据权利要求1所述的语音交互系统，其中，
所述用户状态检测单元将所述用户的情绪检测作为所述用户状态，以及
所述学习模型选择单元选择与所述用户的所述情绪相对应的所述学习模型。

6.根据权利要求1所述的语音交互系统，其中，
所述用户状态检测单元将所述用户的健康状况检测作为所述用户状态，以及
所述学习模型选择单元选择与所述用户的所述健康状况相对应的所述学习模型。

7.根据权利要求1所述的语音交互系统，其中，
所述用户状态检测单元将所述用户的唤醒状态的程度检测作为所述用户状态，以及
所述学习模型选择单元选择与所述用户的所述唤醒状态的程度相对应的所述学习模型。

8.一种由语音交互系统执行的语音交互方法，所述语音交互系统通过使用语音与用户进行会话，所述语音交互方法包括：
获取由所述用户给出...

【专利技术属性】
技术研发人员：河原达也，堀达朗，渡部生圣，
申请(专利权)人：国立大学法人京都大学，丰田自动车株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人