【技术实现步骤摘要】
人机交互方法、系统、设备及存储介质
[0001]本申请实施例涉及计算机
,具体而言,涉及一种人机交互方法、系统、设备及存储介质。
技术介绍
[0002]在现代智能化社会中,人机交互在医疗、餐饮、家居、文旅、金融等越来越丰富的应用场景得到广泛使用。在人机交互时,人们希望和机器人交流时能够像和其他人交流时一样轻松自然,而如今市场中的人机交互方式并不能做到这一点。这是因为现有的人机交互,例如人机语音问答或者通过内置的程序在触控板上的触屏交互,和人与人之间的沟通方式有着很大的不同:例如,人与人之间的沟通交流除了依靠说话之外,还包括视觉上的交流,如包括手势、朝向、眼神等,这些都是很重要的一部分;又如,从交互内容上来看,几乎都是由人类进行主导,机器人主要负责被动回答用户的问题、完成用户的指令。
[0003]因此目前的人机交互是比较机械僵硬的,机器人也缺乏交互的主动性。为了能够实现更加和谐自然的人机交互,我们认为有必要让服务机器人学习人与人的交流方式,并且希望机器人可以像人一样分析对方关注的需求,从而主动展开交互。
【技术保护点】
【技术特征摘要】
1.一种人机交互方法,其特征在于,所述方法包括:通过摄像头获取第一深度图像,所述第一深度图像是包括交互者头部的深度图像;采用注意力方向检测算法检测所述第一深度图像,获得注意力方向;依据所述注意力方向转动摄像头,获取第二深度图像;对所述第二深度图像进行目标识别;当所述第二深度图像中包含候选目标时,获取各候选目标所在的图像区域;将各候选目标的图像区域的中心坐标都转换至所述第二深度图像的三维坐标系下,得到各候选目标在所述第二深度图像中的三维深度坐标;将各候选目标在所述第二深度图像中的三维深度坐标都变换至所述第一深度图像的三维坐标系下,得到各候选目标在所述第一深度图像中的三维深度坐标;计算各候选目标在所述第一深度图像中的三维深度坐标与所述交互者头部的连线,比较所述连线与注意力方向的夹角;当所述夹角小于预设阈值时,将对应候选目标确定为注视目标;基于所述注视目标与交互者进行交互。2.根据权利要求1所述方法,其特征在于,所述方法还包括:当所述第二深度图像中不包含候选目标时,或当所述第二深度图像中各连线与注意力方向的夹角都大于预设阈值时;重复执行步骤直到确定所述交互目标,所述步骤包括:依据所述注意力方向再次转动摄像头,获取新的深度图像;对所述新的深度图像进行目标识别;当所述新的深度图像中包含候选目标时,获取各候选目标所在的图像区域;将各候选目标的图像区域的中心坐标都转换至所述新的深度图像的三维坐标系下,得到各候选目标在所述新的深度图像中的三维深度坐标;将各候选目标在所述新的深度图像中的三维深度坐标都变换至所述第一深度图像的三维坐标系下,得得到各候选目标在所述第一深度图像中的三维深度坐标;计算各候选目标在所述第一深度图像中的三维深度坐标与所述交互者头部的连线,比较所述连线与注意力方向的夹角;当所述夹角小于预设阈值时,将对应候选目标确定为交互目标。3.根据权利要求1所述方法,其特征在于,所述将各候选目标在所述第二深度图像中的三维深度坐标都变换至所述第一深度图像的三维坐标系下,得到各候选目标在所述第一深度图像中的三维深度坐标,包括:x=x
′
·
cos(
‑
θ)+y
′
·
sin(
‑
θ)+a,y=y
′
cos(
‑
θ)
‑
x
′
·
sin(
‑
θ)+b,z=z
′
,其中,x,y,z分别表示各候选目标在第一深度图像中的长度、宽度、深度坐标值,θ表示摄像头的旋转角度,a,b分别表示第二深度图像的三维坐标系相对于第一深度图像的三维坐标系水平、竖直平移距离。4.根据权利要求1所述方法,其特征在于,所述基于所述交互目标与交互者进行交互,包括:
通过注意强度算法对所述交互者的注意力强度进行分析,得到注意力强度权值;基于所述注意力强度权值和所述交互目标与所述交互者进行交互。5.一种人机交互方法,其特征在于,所述方法包括:通过摄像头获取第一深度图像,所述第一深度图像是包括交互者人体头部信息的深度图像;采用注意力方向检测算法检测所述第一深度图像...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。