当前位置: 首页 > 专利查询>佛山市南海区广工大数控装备协同创新研究院专利>正文

一种基于深度学习的动作识别方法技术

技术编号：24855110 阅读：23 留言：0更新日期：2020-07-10 19:08

本发明专利技术公开了一种基于深度学习的动作识别方法，包括如下步骤：对视频帧F进行提取，划分为T*16帧；对每16帧f

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的动作识别方法
本专利技术涉及计算机视觉识别
，尤其涉及一种基于深度学习的动作识别方法。
技术介绍
随着计算机视觉技术、机器学习技术、特别是深度学习技术的发展，人体行为识别领域得到了长足的进步，并且该领域具有广阔的应用前景，如人机交互、监控无人化、健身训练、医学仿真等等。随着健身产业的兴起，越来越多的人希望能够得到更多的健身动作指导，但是由于场地和专业人员的有限，人们往往未能够得到实时且准确的指导。但是，我们可以借助于人体行为识别技术，做到足不出户便可以知道所做的健身动作正确与否。且相较于较为复杂多样的行为动作识别，健身动作识别的可操作性更强。因为健身动作通常是在固定视角下，且主体在做重复且频率相对一致的健身动作，如深蹲、俯卧撑、桥等等。如此背景单一、主体运动单一的健身动作可以较为轻易地被机器学习模型所学习。传统的动作识别与评判方法，通常是利用基于光度梯度的局部特征检测算法从视频中提取显著光度变化的兴趣点，然后运用专家知识对其进行空间特性、时间特性或时空特性进行描述；最后在特征空间中建立模型进行学习，如支持向量机、高斯判别模型等。但是此类方法得到的模型泛化性不强。近年来，深度学习的发展十分迅猛，深度学习能够有效地从信息中提取特征，特别是卷积神经网络在图像领域的特征表示，但是其不能直接应用于人体行为此类具有三维信息的视频。且由于健身视频中拍摄的角度不同、动作人的频率不同、动作的多样性等等，使得同一健身动作具有多义性。所以现有的技术根据人体关节点如流程图般定义的判断方...

【技术保护点】
1.一种基于深度学习的动作识别方法，其特征在于，包括如下步骤：/n步骤S1：对视频帧F进行提取，划分为T*16帧，即F＝(f

【技术特征摘要】
1.一种基于深度学习的动作识别方法，其特征在于，包括如下步骤：
步骤S1：对视频帧F进行提取，划分为T*16帧，即F＝(f1,f2,...,fT)；
步骤S2：对每16帧fi进行光流提取得到相应的16张光流图；
步骤S3：利用多尺度的3D卷积神经网络分别对连续的16帧RGB图和光流图进行特征提取，分别得到两个特征向量xoriginal和xoptical；
步骤S4：将获得的两个特征向量串联在一起得到特征向量xi，维度为d1；
步骤S5：重复上述步骤并行处理T次，最终得到一个维度为(d1,T)的特征矩阵X；
步骤S6：通过一个以注意力机制为核心构建的一个网络，得到权值矩阵A；
步骤S7：将权值矩阵A代入公式M＝A*...

【专利技术属性】
技术研发人员：张宏，叶汉京，何力，管贻生，黄兴鸿，陈广诚，
申请(专利权)人：佛山市南海区广工大数控装备协同创新研究院，佛山市广工大数控装备技术发展有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人