一种交互式语音识别装置制造方法及图纸

技术编号:24056814 阅读:83 留言:0更新日期:2020-05-07 15:01
本实用新型专利技术涉及一种交互式语音识别装置,包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头角度实现人脸跟踪;通过设置人脸跟踪功能,可以实现更精确的语音识别定位,提高语音识别效率和准确度;设置的远程数据中心可以对语音识别的过程进行数据备份,同时可以对存储装置内的语音识别装置的数据库进行更新,提高语音识别精度,人脸识别装置可提高安全和保密性。

An interactive speech recognition device

【技术实现步骤摘要】
一种交互式语音识别装置
本技术涉及智能机器人领域,具体是一种交互式语音识别装置。
技术介绍
语音识别作为人工智能下很火爆的一门学科,是当下研究的一个重要领域。现阶段语音识别大多实现于智能硬件中,比如和机器人进行人机交互,或者我们智能手机输入法中的语音识别,可以将听到的声音转化为文字,但现有语音识别装置只能被动接受语音进行识别,当声源发生移动或者位置改变时,识别装置极容易受到外部干扰,甚至对干扰源进行识别,从而出现识别错误,并且现有语音识别开启后即进行识别,不能根据声源的类型来确定是否开始工作,造成识别干扰,在有些需要保密的应用场景也不能满足具体要求。
技术实现思路
本技术所要解决的技术问题是提供一种交互式语音识别装置,以解决现有技术中存在的缺陷。本技术解决上述技术问题的技术方案如下:一种交互式语音识别装置,包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头角度实现人脸跟踪;所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头采集监控图像并经控制器传输至存储装置进行存储;所述控制器可以输出语音识别信号并通过语音输出装置进行播放。进一步的,所述语音输入装置为麦克风,所述语音输出装置为扬声器;进一步的,所述第一通讯装置支持RS485、RS232或者CAN接口进行数据传输;进一步的,所述第二通讯装置支持无线wifi、4G或GPRS通信方式。进一步的,所述控制器通过第二通讯装置与远程数据中心连接,用于同步第二摄像头采集的监控图像;进一步的,所述控制器设置有人脸识别装置,其接收第一摄像头采集的人脸图像,并与存储装置预先存储的人脸数据比对,符合则控制语音识别装置开始工作;本技术的有益效果是:通过设置人脸跟踪功能,可以实现更精确的语音识别定位,提高语音识别效率和准确度;设置的远程数据中心可以对语音识别的过程进行数据备份,同时可以对存储装置内的语音识别装置的数据库进行更新,提高语音识别的精度,人脸识别装置可提高安全性和保密性。附图说明图1为本技术结构示意图;附图标记说明如下:1、控制器,2、语音输入装置、3、语音输出装置,4、电源装置,5、人脸跟踪监测装置,6、存储装置,7、第一通讯装置,8、第二通讯装置,9、远程数据中心,10、第一摄像头,11、第二摄像头,12、显示屏;具体实施方式以下结合附图对本技术的原理和特征进行描述,所举实例只用于解释本技术,并非用于限定本技术的范围。如图1所示,一种交互式语音识别装置,包括控制器1及与控制器1分别连接的存储装置6、电源装置4、通过第一通讯装置7连接的语音输入装置2、语音输出装置3、显示屏12和人脸跟踪监测装置5,所述人脸跟踪监测装置5与第一摄像头10和第二摄像头11连接,所述人脸跟踪监测装置5包括伺服电机和电机控制装置,控制器1根据第一摄像头10采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头10角度实现人脸跟踪,所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头11采集监控图像并经控制器1传输至存储装置6进行存储;所述控制器1包含语音识别装置,其对语音输入装置2的语音进行识别后,输出相应信号并通过语音输出装置3进行播放,所述控制器1连接电源装置4,该电源装置为整个装置提供电源;在一个具体应用中,该识别装置可应用于儿童教育机器人,由于儿童生性活泼,喜欢晃来晃去,通过该识别装置可以保证机器人可以一直对准儿童进行监控和语音交互,提高了语音交互的效率。所述语音输入装置2为麦克风,所述语音输出装置3为扬声器;在具体实施时,第一通讯装置连接的部件集成在一起,其通讯方式可以采取稳定可靠的有线通讯方式,如第一通讯装置7可采用支持RS485、RS232或者CAN的接口进行数据传输;而进行数据备份及更新时,由于其对稳定性要求不高,但对装置操控的简便性有要求,要求装置与外界的连线仅可能少,所述第二通讯装置8支持无线wifi、4G或GPRS通信方式,不需要设置长距离的线缆,可以使得装置简洁、成本也较低。所述控制器1通过第二通讯装置8与远程数据中心9连接,用于同步第二摄像头11采集的监控图像;在另一个具体实施例中,该识别装置可应用于银行柜台服务终端,可对整个业务办理过程进行录像并存储至远程数据中心,以备以后查询使用;作为本技术技术方案的进一步改进,所述控制器1还设置有人脸识别装置,其接收第一摄像头10采集的人脸图像,并与存储装置6预先存储的人脸数据比对,符合则控制语音识别装置开始工作;从而进一步提高应用该语音识别装置的装置安全性和保密性能。以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种交互式语音识别装置,其特征在于:包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头角度实现人脸跟踪;所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头采集监控图像并经控制器传输至存储装置进行存储;所述控制器可以输出语音识别信号并通过语音输出装置进行播放。/n

【技术特征摘要】
1.一种交互式语音识别装置,其特征在于:包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头角度实现人脸跟踪;所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头采集监控图像并经控制器传输至存储装置进行存储;所述控制器可以输出语音识别信号并通过语音输出装置进行播放。


2.根据权利要求1所述的一种交互式语音识别装置,其特征在于:所述语音输入装置为麦克风,所...

【专利技术属性】
技术研发人员:张宁郑长水
申请(专利权)人:北京烽火万家科技有限公司郑长水
类型:新型
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1