基于卷积神经网络的舞蹈视频人体骨架检测与提取方法技术

技术编号：22330637 阅读：26 留言：0更新日期：2019-10-19 12:22

本发明专利技术提供了基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，对舞蹈视频预处理获得图片样本，获取COCO数据集图片样本与关键点标注标签，计算标注数据，将计算结果和对应的数据集图片输入模型检测器中不断迭代训练；将待处理的舞蹈图片输入训练后模型检测器中，得到检测结果；对检测结果解析连接，完成多人人体骨架的提取；本发明专利技术实时性高，检测提取准确率高；设计了面向人体部位检测和部位关联的联合学习体系架构，以分数表示部位连接关系的紧密程度，提高检测准确率；图像中的人数增加时也能保持检测提取效率，具有较好的鲁棒性和扩展性。

Detection and extraction of human skeleton in dance video based on convolutional neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的舞蹈视频人体骨架检测与提取方法
本专利技术属于人工智能
，具体涉及基于卷积神经网络的舞蹈视频人体骨架检测与提取方法。
技术介绍
中华民族的舞蹈文化源远流长且种类繁多，随着我国传统文化保护战略的引导，采集民族民间舞蹈动作数据，使民族民间舞蹈动作通过数字化手段保存并传播在当前具有重要的研究意义，但是现在的各种人体姿态估计大多使用传统跟踪的方法或借助动作捕捉工具，实时性不高且对于多人姿态估计准确率低，对舞蹈的美观程度和同步具有很大的影响。因此如何精准检测并提取多人舞蹈视频中的人体姿态骨架并保持较好的实时性，成为当下急需解决的一个问题。
技术实现思路
本专利技术的目的是提供基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，解决了现有人体骨架检测准确率低，实时性差的问题。本专利技术所采用的技术方案是，基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，包括以下步骤：步骤1、对舞蹈视频预处理获得舞蹈图片样本；步骤2、使用具有关键点标注的COCO数据集作为训练集，获取COCO数据集图片样本与关键点标注标签；步骤3、计算步骤2中的标注图片样本，将计算结果和对应的数据集图片输入模型检测器中不断迭代训练；步骤4、将步骤1中待处理的舞蹈图片输入步骤3训练后的模型检测器中，得到检测结果；步骤5、对步骤4中的检测结果解析连接，完成多人人体骨架的提取。本专利技术的特征还在于，步骤1的具体过程为：步骤1-1、获得多人舞蹈视频；步骤1-2、使用MATLAB读取并分析该视频，获取舞蹈视频的视频帧并以图片形式保存到本地文件夹中；步骤1-3、对本地图片统一压缩至分辨率为w×h...

【技术保护点】
1.基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述方法包括以下步骤：步骤1、对舞蹈视频预处理获得舞蹈图片样本；步骤2、使用具有关键点标注的COCO数据集作为训练集，获取COCO数据集图片样本与关键点标注标签；步骤3、计算步骤2中的标注图片样本，将计算结果和对应的数据集图片输入模型检测器中不断迭代训练；步骤4、将步骤1中待处理的舞蹈图片输入步骤3训练后的模型检测器中，得到检测结果；步骤5、对步骤4中的检测结果解析连接，完成多人人体骨架的提取。

【技术特征摘要】
1.基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述方法包括以下步骤：步骤1、对舞蹈视频预处理获得舞蹈图片样本；步骤2、使用具有关键点标注的COCO数据集作为训练集，获取COCO数据集图片样本与关键点标注标签；步骤3、计算步骤2中的标注图片样本，将计算结果和对应的数据集图片输入模型检测器中不断迭代训练；步骤4、将步骤1中待处理的舞蹈图片输入步骤3训练后的模型检测器中，得到检测结果；步骤5、对步骤4中的检测结果解析连接，完成多人人体骨架的提取。2.根据权利要求1所述的基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述步骤1的具体过程为：步骤1-1、获得多人舞蹈视频；步骤1-2、使用MATLAB读取并分析该视频，获取舞蹈视频的视频帧并以图片形式保存到本地文件夹中；步骤1-3、对本地图片统一压缩至分辨率为w×h，得到舞蹈图片样本。3.根据权利要求1所述的基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述步骤3的具体过程为：步骤3-1、计算步骤2所得数据集标注图片标签得到身体部位位置的真值二维置信图S*，表示在每个像素位置都有一个特定的身体部位，并以高斯分布图显示；步骤3-2、据步骤2所得数据集标注图片标签计算得到身体部位关联场的真值二维向量场L*，指明肢体的位置和方向信息；步骤3-3、将步骤2中的COCO数据集图片样本输入模型检测器中，计算预测结果与真值结果的均方误差不断迭代优化网络，得到最小均方误差，训练完成。4.根据权利要求3所述的基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述步骤3-1具体计算过程为，首先为图像中的每个人体k生成单个部位置信图每个像素点p的部位置信图生成公式如下：其中p表示舞蹈图片中的像素点，j表示图片中人体的身体部位，Xj,k表示图中人体k身体部位j的真值部位，σ控制峰值的宽度；然后通过对所有部位置信图取最大进行聚合获得像素点处身体部位分布的置信图公式如下：其中k表示标注图中的人体，j表示身体部位，p表示像素点位置。5.根据权利要求3所述的基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述步骤3-2具体计算过程为，每个像素点p的真值部位关联向量场定义为：其中c表示人体的肢体，k表示人体，v表示身体部位j1到身体部位j2在肢体方向上的单位向量，计算公式如下：v＝(Xj2,k-Xj1,k)/||Xj2,k-Xj1,k||2(4)其中Xj1,k和Xj2,k表示肢体上部位j1和部位j2的位置，部位关联向量场中的点集由肢体上存在的点集构成，即p点满足以下条件：0≤v·(p-Xj1,k)≤lC,K且|V⊥·(p-Xj1,k)|≤σl(5)其中σl是以像素为单位的肢体宽度，lc,k＝||Xj2,k-Xj1,k||2表示肢体长度，v⊥表示垂直于v的向量，最终通过平均所有人体的关联场得到真值部位关联场：其中nc(p)表示所有k个人体中在点p不为0的向量的数量，即不同个体肢体重叠的平均像素。6.根据权利要求3ˉ5任一项所述的基于卷积神经网络的舞蹈视频人体骨架检测与提取方法，其特征在于，所述步骤3-3具体过程为，首先通过模型检测器的第一部分卷积网络获取一组样本特征图F；然后将特征图F输入模型检测器的两个迭代网络同时预测图像中的一组身体部位位置置信图S和一组部位关联场L，其中S＝(S1,S2,...,SJ)表示有J个部位置信图，J表示身体部位总数量；L＝(L1,L2,...,LC)表示有C个部位关联场，C表示肢体总数量；特征图F经过迭代网络的第一次...

【专利技术属性】
技术研发人员：张九龙，李孟阳，屈晓娥，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人