一种智能语音交互机器人制造技术

技术编号:16176804 阅读:59 留言:0更新日期:2017-09-09 04:09
本发明专利技术公开了一种智能语音交互机器人,目的在于解决目前现有的语音智能交互机器人仅能采用一问一答的方式进行控制,人机交互的友好性和安全性不能得到保障的问题。本发明专利技术的机器人通过对其结构的改进,能有效进行双向语音识别,突破现有技术所存在的缺陷。另一方面,基于机器人内部结构的改进,机器人在移动过程中,由于步进电机等设备的基底噪声干扰,所导致的语音交互问题,得到有效解决。本发明专利技术能够实现人与机器人的双向互动交流,有效提升人机交互的友好性,具有显著的进步意义。经实际测试,本发明专利技术的识别精度能达到95%以上,有效实现了说话人与机器人双向语音输入输出的双向进行,使得说话人与机器人之间的友好性和互动性得到极大增强。

【技术实现步骤摘要】
一种智能语音交互机器人
本专利技术涉及机器人领域,尤其是语音交互机器人领域,具体为一种智能语音交互机器人。本专利技术通过对机器人的结构进行改进,提供一种全新的智能语音交互机器人,其采用类似熊猫外形的结构设计,并通过对内部结构进行改进,有效解决了现有语音交互机器人所存在的语音仅能单独输入或输出的问题,对于推动语音交互机器人的发展,推动机器人语音交互技术的进步,具有重要的意义。
技术介绍
语音作为人类所特有的能力,是人类之间交流及获取外界信息资源的重要的工具和渠道,对于人类文明的发展具有重要的意义。语音识别技术作为人机交互分支的重要组成,是人机交互的重要接口,对于人工智能的发展具有重要的实际意义。语音识别技术经过数十年的发展,已经取得了显著的进步,逐步开始从实验室慢慢走向市场。目前,针对特定说话人的语音识别系统已经有较高的识别精度,并被广泛应用于工业、家电、通信、汽车电子、医疗、家庭服务和消费电子类产品等领域。近年来,随着语音识别技术在机器人控制中的应用,机器人的应用领域不断扩大。同时,国内外关于基于语音识别的机器人控制技术的研究也取得了一定的进展。例如,国内有白琳在基于语音识别的机器人控制技术的研究中对语音特征参数提取方法进行了改进,将传统的MFCC特征参数与共振峰参数相结合,提出了新的语音特征参数提取方法。目前,现有的语音交互产品大多基于专用的语音识别芯片,其内核为单片机或数字信号中央处理器,其实质是将麦克风输入的声音信号采样编码,再通过内部处理器与其事先录制好的语音信息匹配,再将相应的语音信息通过片内的模块经过外置的扬声器输出。例如,中国专利CN201620720668.8公开了一种具有语音交互功能的机器人系统,其包括由机器人头部、机器人身部和底座组成的机器人,所述机器人身部内设有一PCB板,所述PCB板连接有一单片机,所述单片机连接有一信号发射电路,所述机器人头部设有图像采集传感器和语音接收器,所述信号发射电路与所述语音接收器、图像采集传感器相连,所述信号发射电路与移动终端相连,所述单片机还连接有一信号接收电路和语音播放器,所述信号接收电路分别与移动终端和语音播放器相连,所述信号发射电路、信号接收电路均连接有一滤波器,所述机器人身部包括机器人手臂、显示装置和输入按钮,所述输入按钮与所述显示装置相连,其能实现语音交互的功能。然而,申请人研究发现,现有的语音识别机器人具有较好的单向识别能力,但双向语音识别能力较弱,主要有如下两方面的问题:1)机器人在移动过程中,由于步进电机等设备的基底噪声干扰,会给语音交互机器人带来不可预知的结果;2)当机器人在说话,或者播放音乐时,即使用户发出指令,机器人也难以对用户发出的指令进行识别,双向语音识别能力几乎丧失,这也是目前现有的机器人主要采用问答方式进行控制的主要原因。基于现有语音交互机器人所存在的上述缺陷,人机交互的友好性和安全性不能得到保障,违背了机器人的三定律。为此,迫切需要一种新的装置,以解决上述问题。
技术实现思路
本专利技术的专利技术目的在于:针对目前现有的语音智能交互机器人仅能采用一问一答的方式进行控制,人机交互的友好性和安全性不能得到保障的问题,提供一种智能语音交互机器人。本专利技术的机器人通过对其结构的改进,能有效进行双向语音识别,突破现有技术所存在的缺陷。另一方面,基于机器人内部结构的改进,机器人在移动过程中,由于步进电机等设备的基底噪声干扰,所导致的语音交互问题,得到有效解决。本专利技术能够实现人与机器人的双向互动交流,有效提升人机交互的友好性,具有显著的进步意义。为了实现上述目的,本专利技术采用如下技术方案:一种智能语音交互机器人,包括底部支撑架、驱动机构、第一腔体、第二腔体、控制系统,所述驱动机构设置在底部支撑架上且驱动机构通过底部支撑架能带动机器人运动,所述第一腔体、第二腔体相连构成机器人主体,所述机器人主体设置在底部支撑架上;所述第二腔体上对称设置有两个第三腔体,所述第一腔体、第二腔体、第三腔体分别为中空结构;所述第一腔体的空腔内设置有第一支撑架,所述第一支撑架与底部支撑架相连,所述第一腔体侧壁上分别设置有第一语音播放装置、第一空腔,所述第一腔体下方设置有第一隔音板,所述第一腔体的第一空腔内从下至上依次设置有上隔音抽屉、下隔音抽屉且第一支撑架能够分别为上隔音抽屉、下隔音抽屉提供支撑,所述第一隔音板位于底部支撑架与下隔音抽屉之间;所述第一腔体与第二腔体之间设置有第二隔音板,所述第三腔体上分别设置有第三语音播放装置、与第三语音播放装置相配合的喇叭孔、语音识别装置,所述第三腔体呈球形,所述第三语音播放装置为两个且分别设置在第三腔体上,所述喇叭孔为若干个且喇叭孔呈扇形环带状,所述语音识别装置位于第三语音播放装置之间;所述控制系统分别与第一语音播放装置、第三语音播放装置、语音识别装置相连。所述机器人主体下方设置有若干个散热孔。若干个散热孔构成矩形设置于主体下方。所述第一腔体上还设置有凹槽,所述凹槽内设置有与控制系统相连的信号接收器、扶手中的一种或多种。所述信号接收器设置在第一支撑架上。还包括与控制系统相连的显示器,所述显示器设置在第二腔体的侧壁上,所述显示器位于两个第三腔体之间且语音识别装置设置在显示器下方。所述显示器与水平面之间的夹角为15~90°。所述上隔音抽屉、下隔音抽屉之间设置有第三隔音板。所述语音识别装置位于第三语音播放装置之间的中线上。还包括摄像头跟随机构、避障机构,所述摄像头跟随机构、避障机构分别设置在机器人主体上且摄像头跟随机构、避障机构分别与控制系统相连,所述控制系统能够接受、处理摄像头跟随机构传输的图像信号以及避障机构所检测的位置信号,进而控制驱动机构的动作。还包括与控制系统相连的导航机构。用于前述智能语音交互机器人交互系统的方法,包括如下步骤:(一)判断语音输入类型1)判断语音输入类型,若为输入输出双向识别系统,则执行步骤(二),若为输入单向识别系统,则执行步骤(三);(二)预定义输入输出双向识别系统;2)预定义语音输出表,并根据预定义语音输出表采集语音播放装置组成输出样本集和输出测试集;3)预定义语音词汇表,并根据该语音词汇表采集语音样本数据组成输入样本集和输入测试集;4)分别对输出样本集内的N个语音样本、输入样本集内的M个语音样本全排列,得到N!M!个排列;分别将每一个排列输入训练系统中,得到一个训练好的语音矢量中心;最后求出N!M!个语音矢量中心的平均矢量和方差参数,得到最终的语音训练模板;其中,N、M为大于1的整数;5)同时使用输出测试集、输入测试集中的语音样本作为待测语音进行测试,得到不同语音样本下的鲁棒性程度,包括每个语音样本的正确识别率和语音样本平均正确识别率;6)按照语音样本正确识别率的大小对语音样本进行排序,选择单词正确识别率大于平均正确识别率的语音样本组成双向候选词汇表;7)针对双向候选词汇表,再次使用步骤4)训练语音模板,得到各个语音模板的平均矢量μ1和平均方差σ1;8)当待测语音输入时,计算待测语音与各语音模板的匹配距离,选择最小匹配距离对应的语音模板为识别结果;9)输出待测语音的识别结果;(三)预定义输入单向识别系统;10)对步骤3)内输入样本集内的M个语音样本全排列,得到M!个排列;分别将每一个排列输入训练系统中,本文档来自技高网
...
一种智能语音交互机器人

【技术保护点】
一种智能语音交互机器人,包括底部支撑架、驱动机构、第一腔体、第二腔体、控制系统,所述驱动机构设置在底部支撑架上且驱动机构通过底部支撑架能带动机器人运动,所述第一腔体、第二腔体相连构成机器人主体,所述机器人主体设置在底部支撑架上;其特征在于,所述第二腔体上对称设置有两个第三腔体,所述第一腔体、第二腔体、第三腔体分别为中空结构;所述第一腔体的空腔内设置有第一支撑架,所述第一支撑架与底部支撑架相连,所述第一腔体侧壁上分别设置有第一语音播放装置、第一空腔,所述第一腔体下方设置有第一隔音板,所述第一腔体的第一空腔内从下至上依次设置有上隔音抽屉、下隔音抽屉且第一支撑架能够分别为上隔音抽屉、下隔音抽屉提供支撑,所述第一隔音板位于底部支撑架与下隔音抽屉之间;所述第一腔体与第二腔体之间设置有第二隔音板,所述第三腔体上分别设置有第三语音播放装置、与第三语音播放装置相配合的喇叭孔、语音识别装置,所述第三腔体呈球形,所述第三语音播放装置为两个且分别设置在第三腔体上,所述喇叭孔为若干个且喇叭孔呈扇形环带状,所述语音识别装置位于第三语音播放装置之间;所述控制系统分别与第一语音播放装置、第三语音播放装置、语音识别装置相连。...

【技术特征摘要】
1.一种智能语音交互机器人,包括底部支撑架、驱动机构、第一腔体、第二腔体、控制系统,所述驱动机构设置在底部支撑架上且驱动机构通过底部支撑架能带动机器人运动,所述第一腔体、第二腔体相连构成机器人主体,所述机器人主体设置在底部支撑架上;其特征在于,所述第二腔体上对称设置有两个第三腔体,所述第一腔体、第二腔体、第三腔体分别为中空结构;所述第一腔体的空腔内设置有第一支撑架,所述第一支撑架与底部支撑架相连,所述第一腔体侧壁上分别设置有第一语音播放装置、第一空腔,所述第一腔体下方设置有第一隔音板,所述第一腔体的第一空腔内从下至上依次设置有上隔音抽屉、下隔音抽屉且第一支撑架能够分别为上隔音抽屉、下隔音抽屉提供支撑,所述第一隔音板位于底部支撑架与下隔音抽屉之间;所述第一腔体与第二腔体之间设置有第二隔音板,所述第三腔体上分别设置有第三语音播放装置、与第三语音播放装置相配合的喇叭孔、语音识别装置,所述第三腔体呈球形,所述第三语音播放装置为两个且分别设置在第三腔体上,所述喇叭孔为若干个且喇叭孔呈扇形环带状,所述语音识别装置位于第三语音播放装置之间;所述控制系统分别与第一语音播放装置、第三语音播放装置、语音识别装置相连。2.根据权利要求1所述智能语音交互机器人,其特征在于,所述第一腔体上还设置有凹槽,所述凹槽内设置有与控制系统相连的信号接收器、扶手中的一种或多种。3.根据权利要求2所述智能语音交互机器人,其特征在于,所述信号接收器设置在第一支撑架上。4.根据权利要求1所述智能语音交互机器人,其特征在于,还包括与控制系统相连的显示器,所述显示器设置在第二腔体的侧壁上,所述显示器位于两个第三腔体之间且语音识别装置设置在显示器下方。5.根据权利要求4所述智能语音交互机器人,其特征在于,所述显示器与水平面之间的夹角为15~90°。6.根据权利要求1~5任一项所述智能语音交互机器人,其特征在于,所述上隔音抽屉、下隔音抽屉之间设置有第三隔音板。7.根据权利要求1~6任一项所述智能语音交互机器人,其特征在于,所述语音识别装置位于第三语音播放装置之间的中线上。8.根据权利要求1~7任一项所述智能语音交互机器人,其特征在于,还包括摄像头跟随机构、避障机构,所述摄像头跟随机构、避障机构分别设置在机器人主体上且摄像头跟随机构、避障机构分别与控制系统相连,所述控制系统能够接受、处理摄像头跟随机构传输的图像信号以及避障机构所检测的位置信号,进而控制驱动机构...

【专利技术属性】
技术研发人员:臧红彬周颖玥
申请(专利权)人:西南科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1