【技术实现步骤摘要】
装置、机器人、方法以及程序
本公开涉及处理语音的装置、机器人(robot)、方法以及程序。
技术介绍
近年来,正在积极地进行如下研究,即、通过处理用户发出的语音来进行用户的情感识别。作为现有的情感识别的方法,存在使用说话者所发出的语音的语言信息的方法、使用语音的声音韵律的特性的方法、进行根据脸部图像的表情分析的方法等。专利文献1中公开了以用户发出的语音的语言信息为基础进行情感识别的技术的一例。具体而言,专利文献1公开如下技术:在对于“玩足球高兴吗?”这一提问,利用者回答说“玩足球非常无聊哦”的情况下,提取“足球”作为关键字,由于包含关键字的短语中含有“非常无聊”这一表示负面情感的话语,因此推论为利用者对足球不感兴趣,并进行关于足球以外的提问。另外,专利文献2中公开了从被输入的用户的语音以及脸部图像来判定其情感,输出与判定出的情感相应的应答(响应)的技术的一例。具体而言,专利文献2公开如下技术:进行根据使用了由PaulEkman等人开发的FACS(FacialActionCodingSystem,脸部运动编码体系)的表情的情感识别(愤怒、讨厌、恐惧、喜悦、悲伤、惊讶、普通)、和基于语音的情感识别(紧张、喜悦、困惑),对各个情感识别结果加权,算出紧张的评价值,基于算出的紧张的评价值,判定有无紧张的情感,在有紧张情感的情况下,使机器人进行缓解紧张的行动。另外,在基于这种情感识别的机器人控制中,多数是假定一位用户,而设想了假定两个以上的用户的机器人的控制的并不多。作为假定了多个用户的现有技术的一例,已有专利文献3。专利文献3公开如下技术:对第二用户(例如小孩)的行 ...
【技术保护点】
1.一种装置,是处理语音的装置,具备:麦克风,其取得所述装置周边的声音;存储器;第1判断部,其从所述取得的声音中提取语音,判断所述语音中是否包含大人的话语;语音识别部,其在判断为所述语音中含有大人的话语的情况下,识别所述大人的话语,判断存储于所述存储器的辞典所包含的词句是否包含于所述大人的话语,所述辞典包含所述大人提醒小孩时可能使用的词句;第2判断部,其在判断为所述大人的话语中含有所述辞典所包含的词句的情况下,基于所述大人的话语的物理特征量,判断所述大人是在发怒还是在申斥;以及控制部,其在判断为所述大人在发怒的情况下,使所述装置进行第1处理,并且,所述装置还具备扬声器、显示器和摄像头中的某一个,所述摄像头取得所述装置周边的影像数据,在所述装置具备所述扬声器的情况下,所述第1处理包括(i)使所述扬声器输出第1声音的处理和(ii)使所述装置进行第1动作的处理中的某一处理,在所述装置具备所述显示器的情况下,所述第1处理包括(i)使所述显示器进行第1表示的处理和(ii)使所述装置进行第1动作的处理中的某一处理,在所述装置具备所述摄像头的情况下,所述第1处理包括(i)使所述摄像头拍摄所述大人的处 ...
【技术特征摘要】
2017.03.08 JP 2017-0443251.一种装置,是处理语音的装置,具备:麦克风,其取得所述装置周边的声音;存储器;第1判断部,其从所述取得的声音中提取语音,判断所述语音中是否包含大人的话语;语音识别部,其在判断为所述语音中含有大人的话语的情况下,识别所述大人的话语,判断存储于所述存储器的辞典所包含的词句是否包含于所述大人的话语,所述辞典包含所述大人提醒小孩时可能使用的词句;第2判断部,其在判断为所述大人的话语中含有所述辞典所包含的词句的情况下,基于所述大人的话语的物理特征量,判断所述大人是在发怒还是在申斥;以及控制部,其在判断为所述大人在发怒的情况下,使所述装置进行第1处理,并且,所述装置还具备扬声器、显示器和摄像头中的某一个,所述摄像头取得所述装置周边的影像数据,在所述装置具备所述扬声器的情况下,所述第1处理包括(i)使所述扬声器输出第1声音的处理和(ii)使所述装置进行第1动作的处理中的某一处理,在所述装置具备所述显示器的情况下,所述第1处理包括(i)使所述显示器进行第1表示的处理和(ii)使所述装置进行第1动作的处理中的某一处理,在所述装置具备所述摄像头的情况下,所述第1处理包括(i)使所述摄像头拍摄所述大人的处理和(ii)使所述装置进行第1动作的处理中的某一处理。2.根据权利要求1所述的装置,所述第1声音包括预定警报声。3.根据权利要求1所述的装置,所述第1声音包括将所述大人在发怒这一情况通知给所述大人的语音。4.根据权利要求1所述的装置,所述第1声音包括促使所述大人释放愤怒的语音。5.根据权利要求1所述的装置,所述第1动作包括使所述显示器与所述大人对向的动作。6.根据权利要求1所述的装置,所述第1动作包括所述装置朝向所述大人的动作。7.根据权利要求1所述的装置,所述第1动作包括所述装置左右摇晃的动作。8.根据权利要求1所述的装置,所述第1表示包括象征性地表现所述装置的眼和嘴的表示,所述表示与所述装置的预定表情对应。9.根据权利要求8所述的装置,所述预定表情包括悲伤的表情、惊讶的表情、困惑的表情、愤怒的表情中的某一个。10.根据权利要求1所述的装置,所述第2判断部在所述大人的话语的物理特征量多次超过阈值的情况下,判断为所述大人在发怒。11.根据权利要求10所述的装置,所述物理特征量包括所述语音的频率、所述语音的音量、所述话语的速度、所述话语的时间中的某一个。12.根据权利要求1所述的装置,在所述装置具备所述摄像头的情况下,所述第2判断部在基于暂且判断为所述大人在发怒之后的第1期间内的所述影像数据,判断为所述大人露出愤怒以及悲伤以外的表情的情况下,判断为所述大人在申斥。13.根据权利要求1所述的装置,所述语音识别部进一步基于存储于所述存储器的表示所述小孩的姓名的数据,判断所述大人的话语中是否含有与所述小孩的姓名对应的词句,所述第2判断部进一步在判断为所述大人的话语中含有与所述小孩的姓名对应的词句的情况下,还将所述小孩判断为是所述大人在申斥或者在发怒的对象者...
【专利技术属性】
技术研发人员:笹川路子,宫崎亮太,
申请(专利权)人:松下知识产权经营株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。