The invention discloses a man-machine interactive action detection method, a device, a storage medium and a processor. Among them, the method comprises the following steps: according to preset multilayer convolutional neural network to detect the target image, and get a classification frame coordinate corresponding to at least one target object in the image; determining at least one target confidence highest target object detection object; and category frame coordinate corresponding to the target object detection the input to the preset multi stage regression convolutional neural network, and then the position detection of human knee on target detection object, get the position coordinates of the body joints in the object detection; location coordinates are normalized and tested according to the preset position coordinates of the multilayer recurrent neural network after the normalization, get the target image the category labels. The invention solves the technical problem that the detection accuracy and the efficiency of the human-computer interaction are low in the existing technology.
【技术实现步骤摘要】
人机交互动作检测方法、装置、存储介质及处理器
本专利技术涉及人机交互领域,具体而言,涉及一种人机交互动作检测方法、装置、存储介质及处理器。
技术介绍
人机交互动作检测和分类是人机交互的一项基础技术,对于智能家居、安防系统和病人监护等人类与电子设备交互的场景中具有重要意义。例如医疗行业,在手势识别的帮助下,聋哑病人可以在护士不在时,通过一个摄像头和简单的手势将需求传达给医院,解决了独立电子设备配置昂贵和病人不会使用计算机等问题。当前用于人体动作识别的方法为基于two-stream卷积神经网络的方法,其将含时间信息光流场和RBG图像同时输入卷积神经网络并进行信息融合,最终输出整段视频的类别标签。由于光流场含的时间信息局限于附近几帧,限制了结果的准确性,并且由于输出为一段视频的类别标签,需要逐帧对时间窗口进行滑动,计算了大量重复信息,限制了系统的效率和实时性。综上,现有技术中的人机交互动作检测存在准确度和效率较低的技术问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种人机交互动作检测方法、装置、存储介质及处理器,以至少解决现有技术中存在的人机交互动作检测准确度和效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种人机交互动作检测方法,该方法包括:根据预设多层卷积神经网络对目标图片进行检测,得到上述目标图片中存在的至少一个目标对象对应的类别以及上述至少一个目标对象对应的边框坐标;确定上述至少一个目标对象中置信度最高的上述目标对象为目标检测对象;将上述目标检测对象对应的上述类别和上述目标检测对象对应的上述边框坐标输入至 ...
【技术保护点】
一种人机交互动作检测方法,其特征在于,包括:根据预设多层卷积神经网络对目标图片进行检测,得到所述目标图片中存在的至少一个目标对象对应的类别以及所述至少一个目标对象对应的边框坐标;确定所述至少一个目标对象中置信度最高的所述目标对象为目标检测对象;将所述目标检测对象对应的所述类别和所述目标检测对象对应的所述边框坐标输入至预设多阶段回归卷积神经网络,进而根据所述预设多阶段回归卷积神经网络对所述目标检测对象进行人体关节部位的位置检测,得到所述目标检测对象中的所述人体关节部位的位置坐标;对所述位置坐标进行归一化处理,进而根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果,其中,所述检测结果中至少包括所述目标图片的类别标签。
【技术特征摘要】
1.一种人机交互动作检测方法,其特征在于,包括:根据预设多层卷积神经网络对目标图片进行检测,得到所述目标图片中存在的至少一个目标对象对应的类别以及所述至少一个目标对象对应的边框坐标;确定所述至少一个目标对象中置信度最高的所述目标对象为目标检测对象;将所述目标检测对象对应的所述类别和所述目标检测对象对应的所述边框坐标输入至预设多阶段回归卷积神经网络,进而根据所述预设多阶段回归卷积神经网络对所述目标检测对象进行人体关节部位的位置检测,得到所述目标检测对象中的所述人体关节部位的位置坐标;对所述位置坐标进行归一化处理,进而根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果,其中,所述检测结果中至少包括所述目标图片的类别标签。2.根据权利要求1所述的方法,其特征在于,在根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测之前,所述方法还包括:根据预设损失函数和预设算法对所述预设多层递归神经网络进行训练,其中,所述预设损失函数为分类函数,所述预设算法为基于时间尺度的反向传播算法。3.根据权利要求1所述的方法,其特征在于,所述根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果包括:根据所述预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片对应的多个类别以及所述多个类别中的每个所述类别对应的多个激活值;在预设时间窗内获取每个所述类别对应的所述多个激活值的平均值;将多个所述平均值中的最大平均值对应的所述类别确定为所述目标图片的类别标签,从而得到所述检测结果。4.根据权利要求1所述的方法,其特征在于,在根据预设多层卷积神经网络对目标图片进行检测之前,所述方法还包括:获取预设摄像头中拍摄到的人体姿态视频图像;将所述人体姿态视频图像中的任意一帧图片确定为所述目标图片。5.一种人机交互动作检测装置,其特征在于,包括:检测单元,用于根据预设多层卷积神经网络对目标图片进行检测,得到所述目标图片中存...
【专利技术属性】
技术研发人员:王志鹏,周文明,
申请(专利权)人:珠海习悦信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。