一种人机交互机器人制造技术

技术编号：38752050 阅读：15 留言：0更新日期：2023-09-09 11:18

本发明专利技术公开一种人机交互机器人，涉及人机交互技术领域，该机器人包括：图像检测模块对输入的图像进行用户位置信息识别和用户表情识别；所述用户位置信息包括中心坐标、景深、在画面中所占面积和用户位置与相机之间的距离；声音识别模块对输入的用户声音进行用户情绪识别；用户界面显示用户位置信息、用户表情和用户情绪；大语言模型根据用户位置信息、用户表情和用户情绪输出反馈信息；反馈信息包括文字信息和语音信息；机械臂根据反馈信息从设定动作库中提取与反馈信息匹配的反馈动作并输出；设定动作库用于存储多个反馈动作，且各反馈动作绑定多个信息关键字。本发明专利技术可实现文字、语音和动作多模态的信息交互，提高了信息交互的多样性。交互的多样性。交互的多样性。

全部详细技术资料下载

【技术实现步骤摘要】
一种人机交互机器人

[0001]本专利技术涉及人机交互
，特别是涉及一种人机交互机器人。

技术介绍

[0002]当前，智能服务机器人与服务对象的交互主要是通过语音实现。智能服务机器人与服务对象的交互方式单一，不能与用户进行多模态的信息交互。

技术实现思路

[0003]本专利技术的目的是提供一种人机交互机器人，可实现文字、语音和动作多模态的信息交互，提高了信息交互的多样性。
[0004]为实现上述目的，本专利技术提供了如下方案：
[0005]一种人机交互机器人，包括：
[0006]相机，用于获取用户图像；
[0007]图像检测模块，用于对输入的用户图像进行用户位置信息识别和用户表情识别；所述用户位置信息包括中心坐标、景深、在画面中所占面积和用户位置与所述相机之间的距离；
[0008]声音识别模块，用于对采集的用户声音进行用户情绪识别；
[0009]用户界面，用于显示所述图像检测模块输出的用户位置信息和用户表情，还用于显示所述声音识别模块输出的用户情绪；
[0010]大语言模型，用于根据用户位置信息、用户表情和用户情绪，输出反馈信息；所述反馈信息包括文字信息和语音信息；
[0011]机械臂，用于根据反馈信息从设定动作库中提取与所述反馈信息匹配的反馈动作并输出；所述设定动作库用于存储多个反馈动作，且各反馈动作绑定多个信息关键字。
[0012]可选地，所述图像检测模块包括目标识别模型，所述目标识别模型是根据训练集对yolov5网络进...

【技术保护点】

【技术特征摘要】
1.一种人机交互机器人，其特征在于，包括：相机，用于获取用户图像；图像检测模块，用于对输入的用户图像进行用户位置信息识别和用户表情识别；所述用户位置信息包括中心坐标、景深、在画面中所占面积和用户位置与所述相机之间的距离；声音识别模块，用于对采集的用户声音进行用户情绪识别；用户界面，用于显示所述图像检测模块输出的用户位置信息和用户表情，还用于显示所述声音识别模块输出的用户情绪；大语言模型，用于根据用户位置信息、用户表情和用户情绪，输出反馈信息；所述反馈信息包括文字信息和语音信息；机械臂，用于根据反馈信息从设定动作库中提取与所述反馈信息匹配的反馈动作并输出；所述设定动作库用于存储多个反馈动作，且各反馈动作绑定多个信息关键字。2.根据权利要求1所述的人机交互机器人，其特征在于，所述相机设置在所述机械臂上。3.根据权利要求1所述的人机交互机器人，其特征在于，所述图像检测模块包括目标识别模型，所述目标识别模型是根据训练集对yolov5网络进行训练得到的，所...

【专利技术属性】
技术研发人员：朱国牛，包泽宇，谈金林，王邵丰，丁文超，管宇翔，甘中学，白卫邦，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人