语音交互方法、语音交互装置及机器人制造方法及图纸

技术编号：16464308 阅读：99 留言：0更新日期：2017-10-27 10:42

本发明专利技术实施例提供一种语音交互方法、装置及机器人，所述方法应用于机器人，包括：当接收的声音信号的声源角度在所述机器人的预设角度范围内时，获取图像，识别所述图像中的一个或多个人脸的角度；选取所述人脸角度与所述声源角度最接近的人脸为说话人；以及调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置，以便于对所述声音信号进行响应。通过本方法、装置及机器人，可以使机器人的语音交互功能更智能化和拟人化。

Voice interaction method, voice interactive device and robot

The embodiment of the invention provides a method, device and robot voice interaction, including the method applied to the robot, obtaining images at a preset angle range of the robot when the received sound signal when the sound source, one or more of the face recognition the image in the perspective of face selection; the face angle and the sound source point closest to the speaker; and adjust the angle of the robot, so that the speaker's face fell in front of the robot center center, in order to respond to the voice signal. This method, device and robot can make the voice interaction function of robot more intelligent and anthropomorphic.

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法、语音交互装置及机器人
本专利技术属于机器人领域，尤其涉及一种语音交互方法、语音交互装置及机器人。
技术介绍
随着现代科技的飞速发展，智能机器人的应用范围越来越广泛，不管是家中，还是商场、银行等公共场所都能够见到智能机器人的身影。机器人与说话人的语音交互，一直是机器人智能化，拟人化的重要环节，除了对话上的交互之外，机器人相对于说话人的方向，站位，也是非常重要的智能化体现。现有机器人与说话人语音交互过程中，通常是说话人主动站位到机器人正前方，使得语音交互更流畅。相对而言，机器人不能根据说话人的语音方向自动站位，智能化、拟人化有待改进。
技术实现思路
综上所述，本专利技术实施例提供一种语音交互方法、语音交互装置及机器人，用以实现机器人与说话人语音交互时，准确面向说话人，更加智能化和拟人化。第一方面，本专利技术实施例提供一种语音交互方法，应用于机器人，包括：当接收的声音信号的声源角度在所述机器人的预设角度范围内时，获取图像，识别所述图像中的一个或多个人脸的角度；选取所述人脸角度与所述声源角度最接近的人脸为说话人；以及调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置，以便于对所述声音信号进行响应。进一步的，所述方法还包括：接收所述声音信号；检测所述声音信号的能量；以及当所述声音信号的能量达到所述机器人的阈值，定位所述声音信号的声源角度。进一步的，所述方法还包括：当接收的声音信号的声源角度不在所述机器人的预设角度范围内时，调整所述机器人的角度，使得接收所述声音信号的角度在所述机器人的预设角度范围内。进一步的，所述方法在所述调整所述机器...
语音交互方法、语音交互装置及机器人

【技术保护点】
一种语音交互方法，应用于机器人，其特征在于，包括：当接收的声音信号的声源角度在所述机器人的预设角度范围内时，获取图像，识别所述图像中的一个或多个人脸的角度；选取所述人脸角度与所述声源角度最接近的人脸为说话人；以及调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置，以便于对所述声音信号进行响应。

【技术特征摘要】
1.一种语音交互方法，应用于机器人，其特征在于，包括：当接收的声音信号的声源角度在所述机器人的预设角度范围内时，获取图像，识别所述图像中的一个或多个人脸的角度；选取所述人脸角度与所述声源角度最接近的人脸为说话人；以及调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置，以便于对所述声音信号进行响应。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：接收所述声音信号；检测所述声音信号的能量；以及当所述声音信号的能量达到所述机器人的阈值，定位所述声音信号的声源角度。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：当接收的声音信号的声源角度不在所述机器人的预设角度范围内时，调整所述机器人的角度，使得接收所述声音信号的角度在所述机器人的预设角度范围内。4.根据权利要求1所述的方法，其特征在于，在所述调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置步骤之后，还包括：判断是否超过所述机器人预设的时间间隔；以及，当超过所述机器人所述预设的时间间隔时，获取所述说话人的人脸图像，识别说话人的人脸角度，调整所述机器人的角度，使得所述说话人的脸部中心落在所述机器人前方中心位置。5.根据权利要求1至4任一所述的方法，其特征在于，所述对所述声音信号进行响应包括：对所述声音信号进行语音识别；根据语音识别的结果，进行自然语言理解，检索对应的答案；以及将所述答案以语音合成或者肢体动作的方式回应给所述说话人。6.根据权利要求1至4任一所述的方法，其特征在于，所述声源角度为声源方向与所述机器人正面中心方向之间的角度。7.根据权利要求1至4任一所述的方法，其特征在于，所述人脸角度为所述人脸与所述图像拍摄方向之间的角度。8.一种语音交互装置，应用于机器人，其特征在于，包括：拾音模块，用于判断接收的声音信号的声源角度是否在所述机器人的预...

【专利技术属性】
技术研发人员：蒋化冰，陈岳峰，廖凯，齐鹏举，方园，米万珠，舒剑，吴琨，管伟，罗璇，
申请(专利权)人：上海木爷机器人技术有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人