语音对话装置、语音对话方法、语音对话程序以及机器人制造方法及图纸

技术编号:18352742 阅读:80 留言:0更新日期:2018-07-02 03:37
本公开涉及语音对话装置、语音对话方法、语音对话程序以及机器人。语音对话装置具备:话题候选提取部,其在判定为家长和孩子正在交谈、且判定为需要向家长和孩子重新提供话题的情况下,基于对话历史记录数据库、和存储表示幼儿在第1预定期间活动了的项目的活动项目的幼儿活动数据库,提取与活动项目对应、并且与记录于第1数据库的文本数据所包含的活动项目不对应的话题的候选;提供话题判断部,其从话题的候选中选择向家长和孩子提供的一个话题;语音合成部,其生成包括一个话题的语音数据;以及扬声器,其输出语音数据。

【技术实现步骤摘要】
语音对话装置、语音对话方法、语音对话程序以及机器人
本公开涉及与多个用户进行语音对话的语音对话装置、语音对话方法、语音对话程序以及机器人,并且,涉及与用户进行语音对话的语音对话装置、语音对话方法、语音对话程序以及机器人。
技术介绍
在现有技术中,提供与对话者彼此所说的话关联的事情作为话题(例如参照专利文献1、专利文献2以及专利文献3)。现有技术文献专利文献1:日本特开2016-6607号公报专利文献2:日本特开2013-73355号公报专利文献3:日本专利第5300497号说明书
技术实现思路
专利技术所要解决的问题在大人与幼儿的对话中,希望提供幼儿易聊的话题。然而,在上述现有技术中,需要进一步的改善。本公开是为了解决上述问题而做出的,提供语音对话装置、语音对话方法、语音对话程序以及机器人,该语音对话装置、语音对话方法、语音对话程序以及机器人能够提供与幼儿的活动内容相应的话题,能够提供幼儿易交谈的话题。用于解决问题的技术方案本公开的一个技术方案涉及的装置,是与多个用户进行语音对话的装置,具备:传感器,其取得所述装置周边的图像数据;麦克风,其取得所述装置周边的声音;存储器,其存储有与所述多个用户对应的多个图像数据,所述多个用户包括大人和幼儿;推定部,其基于所述取得的图像数据和所述存储的多个图像数据,推定所述取得的图像数据所包含的人物,输出表示所述推定出的人物的用户信息;语音识别部,其从所述取得的声音中提取语音,提取与所述语音对应的文本数据和所述语音的特征量,将所述文本数据与所述特征量关联并记录于第1数据库;第1判定部,其基于所述用户信息和所述第1数据库,判定所述大人与所述幼儿是否正在交谈,在所述推定出的人物是所述大人和所述幼儿、并且所述特征量包括互不相同的多个特征量的情况下,判定为所述大人与所述幼儿正在交谈;第2判定部,其在判定为所述大人与所述幼儿正在交谈的情况下,基于所述第1数据库,判定是否需要向所述大人和所述幼儿重新提供话题,在所述文本数据包含有第1关键字的情况下,判定为需要向所述大人和所述幼儿重新提供话题;提取部,其在判定为需要提供所述话题的情况下,基于所述第1数据库和第2数据库,提取所述话题的候选,所述第2数据库存储表示所述幼儿在第1预定期间活动了的项目的活动项目,所述话题的候选与所述活动项目对应,并且与记录于所述第1数据库的所述文本数据所包含的活动项目不对应;选择部,其从所述话题的候选中选择向所述大人和所述幼儿提供的一个话题;生成部,其生成包括所述一个话题的语音数据;以及扬声器,其输出所述生成的语音数据。专利技术效果根据本公开,能够提供与幼儿的活动内容相应的话题,能够提供幼儿易交谈的话题。附图说明图1是用于说明话题提供装置与小孩对话,确定小孩当前正在进行活动的活动项目,并且测定小孩的运动量以及嗓音的音量,使活动项目、运动量和音量编入数据库的处理的示意图。图2是用于说明在亲子对话时,话题提供装置确定对话的话题的处理的示意图。图3是用于说明话题提供装置选择接下来要对家长和孩子提供的话题的处理的示意图。图4是用于说明话题提供装置将所选择的话题提供给家长和孩子的处理的示意图。图5是表示本实施方式1中的话题提供装置的整体结构的图。图6是表示本实施方式1中的话题提供装置的第1处理部的构成的图。图7是表示本实施方式1中的对话历史记录数据库的一例的图。图8是表示本实施方式1中的幼儿活动数据库的一例的图。图9是用于说明本实施方式1中的提供话题判断部从话题的候选中选择向大人和幼儿提供的一个话题的处理的图。图10是表示由本实施方式1中的话题提供装置进行的话题提供处理的一例的流程图。图11是用于说明图10的步骤S13的提供话题文生成处理的流程图。图12是表示本实施方式2中的话题提供装置的第2处理部的构成的图。图13是表示在本实施方式2中活动项目推定部推定活动项目时所使用的关联了活动项目、人体的各部位的运动量、和姿势的状态的表的图。图14是表示由本实施方式2中的话题提供装置进行的登记处理的一例的第1流程图。图15是表示由本实施方式2中的话题提供装置进行的登记处理的一例的第2流程图。图16是本实施方式3涉及的机器人的外观图。图17是表示本实施方式3涉及的机器人的构成的框图。标号说明100:话题提供装置101:传感器102:麦克风103:人物推定部104:语音识别部105:响应文生成部106:语音合成部107:扬声器108:存储器200:第1处理部201:亲子对话判断部202:对话历史记录数据库203:话题提供判断部204:幼儿活动数据库205:对话话题判断部206:话题候选提取部207:提供话题判断部300:第2处理部301:姿势推定部302:运动量测定部303:活动项目推定部304:音量测定部305:活动项目判断部306:活动项目登记部400:机器人401:控制电路402:主控制部403:驱动控制部404:驱动部405:主壳体406:球冠部具体实施方式(成为本公开的基础的见解)专利文献1公开了一种使经由网络进行的对话式的通话顺畅地推进的对话式通信系统。在专利文献1中,对话式通信系统在多个用户的交谈停滞的情况下,从字符(word)数据库随机提取在最近几个月以内出现于对话式通信系统的交谈中的字符,并且,从位置信息数据库随机提取在最近几个月以内利用过对话式通信系统的用户终端的位置信息,访问检索网站或者新闻网站来检索与提取到的字符和位置信息吻合的话题,并提供检索到的话题(例如参照段落0038)。另外,专利文献1的对话式通信系统将检索到的话题所包含的文本数据或者图像数据显示于对话式通信画面(例如参照段落0039)。另外,专利文献2公开了一种辅助由多个说话人进行的对话的对话辅助装置。在专利文献2中,对话辅助装置在机器翻译介于对话的情况下,根据对话来提示用于补充知识的补充信息。专利文献2的对话辅助装置从对话者的说话内容中提取关键字,从补充说明数据库输出与关键字对应的多个补充信息,从多个补充信息中按优先级自高向低的顺序选择预先确定的个数的补充信息并进行提示(例如参照段落0091、0095以及0097)。另外,专利文献3公开了一种与用户对话的对话装置。在专利文献3中,对话装置针对用户说的话进行与用户的兴趣度相应的响应。专利文献3的对话装置从构成用户所表达的语言的单词中提取中心词(主要词),判定对于用户的兴趣度至少表示高低的用户兴趣度,从关联词数据库中选择根据用户兴趣度而与中心词关联的关联词,将中心词和关联词插入与这些中心词及关联词之间的概念上的上下关系对应的固定格式文并制作响应文(例如参照段落0011)。然而,在上述的专利文献1中,从检索网站或者新闻网站上检索并提供与随机提取到的过去出现的字符和随机提取到的用户终端的位置信息吻合的话题,因此,无法提供与幼儿的活动内容相应的话题,无法提供幼儿易交谈的话题。另外,在上述的专利文献2中,从对话者的说话内容提取关键字,按优先级的顺序提示与关键字对应的补充信息,因此,无法提供与幼儿的活动内容相应的话题,无法提供幼儿易交谈的话题。另外,在上述的专利文献3中,针对用户说的话进行与用户的兴趣度相应的响应,但没有提供与幼儿的活动内容相应的话题,无法提供幼儿易交谈的话题。(1)本公开的一个技术方案涉及的装本文档来自技高网...
语音对话装置、语音对话方法、语音对话程序以及机器人

【技术保护点】
1.一种装置,是与多个用户进行语音对话的装置,具备:传感器,其取得所述装置周边的图像数据;麦克风,其取得所述装置周边的声音;存储器,其存储有与所述多个用户对应的多个图像数据,所述多个用户包括大人和幼儿;推定部,其基于所述取得的图像数据和所述存储的多个图像数据,推定所述取得的图像数据所包含的人物,输出表示所述推定出的人物的用户信息;语音识别部,其从所述取得的声音中提取语音,提取与所述语音对应的文本数据和所述语音的特征量,将所述文本数据与所述特征量关联并记录于第1数据库;第1判定部,其基于所述用户信息和所述第1数据库,判定所述大人与所述幼儿是否正在交谈,在所述推定出的人物是所述大人和所述幼儿、并且所述特征量包括互不相同的多个特征量的情况下,判定为所述大人与所述幼儿正在交谈;第2判定部,其在判定为所述大人与所述幼儿正在交谈的情况下,基于所述第1数据库,判定是否需要向所述大人和所述幼儿重新提供话题,在所述文本数据包含有第1关键字的情况下,判定为需要向所述大人和所述幼儿重新提供话题;提取部,其在判定为需要提供所述话题的情况下,基于所述第1数据库和第2数据库,提取所述话题的候选,所述第2数据库存储表示所述幼儿在第1预定期间活动了的项目的活动项目,所述话题的候选与所述活动项目对应,并且与记录于所述第1数据库的所述文本数据所包含的活动项目不对应;选择部,其从所述话题的候选中选择向所述大人和所述幼儿提供的一个话题;生成部,其生成包括所述一个话题的语音数据;以及扬声器,其输出所述生成的语音数据。...

【技术特征摘要】
2016.12.14 JP 2016-2421801.一种装置,是与多个用户进行语音对话的装置,具备:传感器,其取得所述装置周边的图像数据;麦克风,其取得所述装置周边的声音;存储器,其存储有与所述多个用户对应的多个图像数据,所述多个用户包括大人和幼儿;推定部,其基于所述取得的图像数据和所述存储的多个图像数据,推定所述取得的图像数据所包含的人物,输出表示所述推定出的人物的用户信息;语音识别部,其从所述取得的声音中提取语音,提取与所述语音对应的文本数据和所述语音的特征量,将所述文本数据与所述特征量关联并记录于第1数据库;第1判定部,其基于所述用户信息和所述第1数据库,判定所述大人与所述幼儿是否正在交谈,在所述推定出的人物是所述大人和所述幼儿、并且所述特征量包括互不相同的多个特征量的情况下,判定为所述大人与所述幼儿正在交谈;第2判定部,其在判定为所述大人与所述幼儿正在交谈的情况下,基于所述第1数据库,判定是否需要向所述大人和所述幼儿重新提供话题,在所述文本数据包含有第1关键字的情况下,判定为需要向所述大人和所述幼儿重新提供话题;提取部,其在判定为需要提供所述话题的情况下,基于所述第1数据库和第2数据库,提取所述话题的候选,所述第2数据库存储表示所述幼儿在第1预定期间活动了的项目的活动项目,所述话题的候选与所述活动项目对应,并且与记录于所述第1数据库的所述文本数据所包含的活动项目不对应;选择部,其从所述话题的候选中选择向所述大人和所述幼儿提供的一个话题;生成部,其生成包括所述一个话题的语音数据;以及扬声器,其输出所述生成的语音数据。2.根据权利要求1所述的装置,所述第2数据库还存储:表示与所述活动项目对应的运动量的运动量信息;表示与所述活动项目对应的音量的音量信息;和表示与所述活动项目对应的日期的日期信息,所述提取部基于所述第2数据库,确定最新的活动项目,提取与所述最新的活动项目和所述文本数据所包含的活动项目不同的第2活动项目来作为所述话题的候选,所述选择部基于与所述最新的活动项目对应的第1运动量、与所述最新的活动项目对应的第1音量、与所述活动项目中的第2活动项目对应的第2运动量、和与所述第2活动项目对应的第2音量,从所述第2活动项目中选择第3活动项目作为所述一个话题。3.根据权利要求2所述的装置,所述选择部将所述第2运动量相对于所述第1运动量的相对运动量的平方、与所述第2音量相对于所述第1音量的相对音量的平方之和成为最大的第2活动项目选择作为所述第3活动项目。4.根据权利要求2所述的装置,所述提取部提取与所述最新的活动项目和所述文本数据所包含的活动项目不同、并且在第2预定期间记录的第2活动项目来作为所述话题的候选。5.根据权利要求2所述的装置,所述运动量信息是对所述运动量乘以第1系数而得到的值,所述音量信息是对所述音量乘以第2系数而得到的值。6.根据权利要求2所述的装置,所述生成部,基于所述第2数据库,在与所述第3活动项目对应的第3运动量大于等于第1阈值的情况下,生成包括第2关键字的所述语音数据,基于所述第2数据库,在与所述第3活动项目对应的第3运动量小于第1阈值的情况下,生成包括第3关键字的所述语音数据。7.根据权利要求6所述的装置,所述第2关键字以及所述第3关键字包括表示投入所述第3活动项目的所述幼儿的活跃度的修饰词,所述第2关键字所示的意思是与所述第3关键字所示的意思相反的意思。8.根据权利要求2所述的装置,所述生成部,基于所述第2数据库,在与所述第3活动项目对应的第3音量大于等于第1阈值的情况下,生成包括第2关键字的所述语音数据,基于所述第2数据库,在与所述第3活动项目对应的第3音量小于所述第1阈值的情况下,生成包括第3关键字的所述语音数据。9.根据权利要求8所述的装置,所述第2关键字以及所述第3关键字包括表示投入所述第3活动项目的所述幼儿的活跃度的修饰词,所述第2关键字所示的意思是与所述第3关键字所示的意思相反的意思。10.根据权利要求1所述的装置,所述特征量包括发出所述语音的说话者的声纹。11.根据权利要求1所述的装置,所述第1关键字包括表示话题的单词。12.一种机器人,具备:权利要求1所述的装置;壳体,其内置所述装置;以及移动机构,其使所述壳体移动。13.一种方法,是与多个用户进行语音对话的装置中的方法,包括:取得所述装置周边的图像数据;取得所述装置周边的声音;基于所述取得的图像数据、和存储与所述多个用户对应的多个图像数据的存储器所存储的多个图像数据,推定所述取得的图像数据所包含的人物,输出表示所述推定出的人物的用户信息,所述多个用户包括大人和幼儿;从所述取得的声音中提取语音,提取与所述语音对应的文本数据和所述语音的特征量,将所述文本数据与所述特征量关联并记录于第1数据库;基于所述用户信息和所述第1数据库,判定所述大人与所述幼儿是否正在交谈,在所述推定出的人物是所述大人和所述幼儿、并且所述特征量包括互不相同的多个特征量的情况下,判定为所述大人与所述幼儿正在交谈;在判定为所述大人与所述幼儿正在交谈的情况下,基于所述第1数据库,判定是否需要向所述大人和所述幼儿重新提供话题,在所述文本数据包含有第1关键字的情况下,判定为需要向所述大人和所述幼儿重新提供话题;在判定为需要提供所述话题的情况下,基于所述第1数据库和第2数据库,提取所述话题的候选,所述第2数据库存储表示所述幼儿在第1预定期间活动了的项目的活动项目,所述话题的候选与所述活动项目对应,并且与记录于所述第1数据库的所述文本数据所包含的活动项目不对应;从所述话题的候选中选择向所述大人和所述幼儿提供的一个话题;生成包括所述一个话题的语音数据;以及输出所述生成的语音数据。14.一种程序,是用于与多个用户进行语音对话的程序,该程序使与所述多个用户进行语音对话的装置所具备的处理器作为如下各部而发挥功能:推定部,其基于通过传感器取得的所述装置周边的图像数据、和存储有与所述多个用户对应的多个图像数据的存储器所存储的多个图像数据,推定所述取得的图像数据所包含的人物,输出表示所述推定出的人物的用户信息,所述多个用户包括大人和幼儿;语音识别部,其从通过麦克风取得的所述装置周边的声音中提取语音,提取与所述语音对应的文本数据和所述语音的特征量,将所述文本数据与所述特征量关联并记录于第1数据库;第1判定部,其基于所述用户信息和所述第1数据库,判定所述大人与所述幼儿是否正在交谈,在所述推定出的人物是所述大人和所述幼儿、并且所述特征量包括互不相同的多个特征量的情况下,判定为所述大人与所述幼儿正在交谈;第2判定部,其在判定为所述大人与所述幼儿正在交谈的情况下,基于所述第1数据库,判定是否需要向所述大人和所述幼儿重新提供话题,在所述文本数据包含有第1关键字的情况下,判定为需要向所述大人和所述幼儿重新提供话题;提取部,其在判定为需要提供所述话题的情况下,基于所述第1数据库和第2数据库,提取所述话题的候选,所述第2数据库存储表示所述幼儿在第1预定期间活动了的项目的活动项目,所述话题的候选与所述活动项目对应,并且与记录于所述第1数据库的所述文本数据所包含的活动项目不对应;选择部,其从所述话题的候选中选择向所述大人和所述幼儿提供的一个话题;以及生成部...

【专利技术属性】
技术研发人员:樋口圣弥国武勇次太田雄策宫崎亮太
申请(专利权)人:松下知识产权经营株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1