基于多媒体舞蹈动作图像分解处理方法技术

技术编号:38550927 阅读:16 留言:0更新日期:2023-08-22 20:57
本发明专利技术涉及图像数据处理技术领域,具体涉及基于多媒体舞蹈动作图像分解处理方法,包括:对舞蹈动作图像进行采集并分类,获得动作图像集,对动作图像集中的图像进行图像分割,得到人体不同区域,进而得到不同图像中的对应区域,分别进行分解,得到独立分量集合,对每个独立分量集合进行聚类,根据聚类结果获得分离度,得到分离度序列,结合所有独立分量序列,得到分离性,进而得到独立分量数量,将得到的独立分量数量,作为ICA算法的参数,进行舞蹈动作图像分解。本发明专利技术根据获得的新对应区域,可以有效减小新对应区域所对应的特征向量的计算误差,优化了对舞蹈动作图像的分解效果,提高了后续对舞蹈动作的判别精度。了后续对舞蹈动作的判别精度。了后续对舞蹈动作的判别精度。

【技术实现步骤摘要】
基于多媒体舞蹈动作图像分解处理方法


[0001]本专利技术涉及图像数据处理
,具体涉及基于多媒体舞蹈动作图像分解处理方法。

技术介绍

[0002]基于多媒体的数据分解通常是指对复杂的多媒体数据进行分析和处理,以提取其中的有用信息或特征,并将其转化为更加方便、可视化、易于理解的形式。这种分解方法可以应用于多种类型的多媒体数据,包括图像、音频、视频等。
[0003]通过ICA方法对舞蹈动作进行分解时,独立成分数量的选取对分解结果的影响较大,独立成分数量指的是要分解的独立成分的数量,可以根据实际需求进行设置。如果独立成分数量过少,可能无法有效地提取数据中的特征信息;而如果数量过多,则会增加计算复杂度和噪声敏感性。合适的独立分量可以对舞蹈动作进行更好的表示,进而将该舞蹈动作与其它舞蹈动作较好的区分开来,不合适的独立成分数量导致后期在对不同舞蹈动作进行自动识别时,识别精度较低。
[0004]基于此,本专利技术提出了一种基于多媒体舞蹈动作图像分解处理方法,通过对一个较大独立分量数量下的ICA分解的分离度进行计算,结合聚类过程中分离度的变化,得到独立分量数量的最佳值,进而作为ICA分解中的独立分量数量的超参数,提高了独立分量的特征表示性能,进而提高了后续的舞蹈动作识别精度。

技术实现思路

[0005]本专利技术提供基于多媒体舞蹈动作图像分解处理方法,以解决现有的问题。
[0006]本专利技术的基于多媒体舞蹈动作图像分解处理方法采用如下技术方案:本专利技术提供了基于多媒体舞蹈动作图像分解处理方法,该方法包括以下步骤:获取舞蹈教学图像,将同一舞蹈动作在不同视角下对应的舞蹈教学图像所形成的集合,记为动作图像集;获取动作图像集中各个图像中人体不同身体部位所在区域,将动作图像集中不同舞蹈教学图像内,同一身体部位所对应的最小外接矩形在面积最大时所对应的区域,记为新对应区域;根据新对应区域中像素点的灰度值获得特征矩阵,根据特征矩阵获得对应的若干个独立分量序列;将同一个对应区域集的新对应区域所对应若干个独立分量序列所形成的集合,记为独立分量集合;将任意独立分量集合中每个独立分量序列作为节点,将任意两个节点对应的独立分量序列的余弦相似度,作为节点之间所形成边的边值,利用获得的节点、节点值、边以及边值构建图结构;对图结构进行多次聚类,将每次聚类获得的聚类簇记为聚类类别,将任意一次聚类下所有聚类类别的集合记为聚类类别集,根据聚类类别中的独立分量序列获得对应的若干个特征向量;根据聚类类别中所有独立分量序列的特征向量之间的余弦相似度的均值,获得聚类类别的分离度;在任意一次聚类下,根据聚类类别的分离度获得
聚类类别集对应的分离性,将最大分离性对应的聚类类别集所包含聚类类别的数量记为独立分量数量;将独立分量数量作为ICA算法的分解数量参数,对舞蹈教学图像进行分解,根据得到每个舞蹈教学图像中各个舞蹈动作对应的独立分量序列实现舞蹈教学和指导。
[0007]进一步的,所述新对应区域,获取方法如下:步骤(1),获取训练好的MaskR

CNN神经网络:首先,获取大量的舞蹈教学图像,将头部、左胳膊、右胳膊、左腿以及右腿作为人工标签,通过人工标注的方法,将每一个舞蹈教学图像中人体的各个身体部位进行标注,将每一个带有各个身体部位标签的舞蹈教学图像都作为一个样本,则由大量样本构成训练MaskR

CNN神经网络的数据集;然后,根据数据集结合交叉熵损失函数对MaskR

CNN神经网络进行训练,获得训练好的MaskR

CNN神经网络;步骤(2),将同一个动作下对应的动作图像集中,不同视角下的舞蹈教学图像所对应的相同标签区域作为对应区域,获取每个对应区域的最小外接矩形的面积,保持矩形中心不变,将多个舞蹈教学图像中同一个身体部位的最大面积的最小外接矩形,作为其他舞蹈教学图像中对应区域的最小外接矩形,将获得新的对应区域,记为新对应区域。
[0008]进一步的,所述根据新对应区域中像素点的灰度值获得特征矩阵,根据特征矩阵获得对应的若干个独立分量序列,包括的具体步骤如下:获取舞蹈教学图像中每个新对应区域的每一行像素点的灰度值,按照像素点所在行的序数,将每一行像素点的灰度值中按照行数进行首尾相连,形成大小的矩阵,记为特征矩阵;利用ICA算法对特征矩阵进行分解,每个特征矩阵都可以得到若干个独立分量序列。
[0009]进一步的,所述聚类类别的分离度,获取方法如下:步骤(1),将任意聚类类别中每一个独立分量序列作为矩阵的一行,将形成的矩阵记为类别矩阵,对类别矩阵通过SVD分解,得到对应的多个特征向量;步骤(2),对聚类类别中任意两个独立分量序列的若干个特征向量进行匹配,通过KM最大匹配原则计算匹配,获取任意两个聚类类别之间的分离度:将两个聚类类别中任意一个独立分量序列的所有特征向量记为左节点,将另一个独立分量序列的所有特征向量记为右节点,节点值为特征向量,每个左节点与所有右节点都有边连接,边值为对应左节点和右节点所对应特征向量的余弦相似度,利用KM算法获取左节点与右节点之间的匹配关系,将所有左节点与右节点之间的匹配关系所对应边值的均值作为所属的两个独立分量序列之间的相似度,将1与相似度的差值作为两个独立分量序列的分离度;步骤(3),获取聚类类别中所有独立分量序列之间的分离度,将所有独立分量序列的分离度的平均值,记为所有独立分量序列所属聚类类别的分离度。
[0010]进一步的,所述聚类类别集对应的分离性,获取方法如下:步骤(1),将任意一次聚类后得到的所有聚类类别的分离度,按照从小到大的顺序排列所形成的序列记为分离度序列,其中表示第i个聚类类别的分离度,n表示聚类类别数量;获取分离度序列中所有分离度的均值以及标准差,将记为离散
系数;根据离散系数构建权重序列,其中表示权重序列中第i个权重值,n表示聚类类别数量;步骤(2),聚类类别集对应的分离性获取方法为:其中,表示聚类后所获得的聚类类别集对应的分离性,表示分离性序列的标准差,表示分离性序列的均值;n表示聚类类别数量;表示第i个聚类类别的分离度;表示权重序列中第i个权重值;表示离散系数。
[0011]进一步的,所述根据得到每个舞蹈教学图像中各个舞蹈动作对应的独立分量序列实现舞蹈教学和指导,包括的具体步骤如下:步骤(1),以动作不标准、良好以及优秀作为人工标签,由行业内专业人员对学生的舞蹈动作所对应的独立分量序列进行人工标注,将带有人工标签的独立分量序列作为样本,则由大量的不同学生和不同舞蹈动作获得对应的样本,构成训练LSTM神经网络的数据集,利用所获得的数据集对LSTM神经网络进行训练,获得训练完成后的LSTM神经网络;步骤(2),将训练完成后的LSTM神经网络投入使用,对学生在模仿学习舞蹈动作时,对学生的舞蹈动作进行判别和评价,实现对学生的舞蹈动作的教学和指导。
[0012]本专利技术的技术方案的有益效果是:通过独立分量聚类过程中分离性的变化,得到一个最佳的独立分量数量,该独立分量数量对应的独立分量的表示性能最好,可以大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多媒体舞蹈动作图像分解处理方法,其特征在于,该方法包括以下步骤:获取舞蹈教学图像,将同一舞蹈动作在不同视角下对应的舞蹈教学图像所形成的集合,记为动作图像集;获取动作图像集中各个图像中人体不同身体部位所在区域,将动作图像集中不同舞蹈教学图像内,同一身体部位所对应的最小外接矩形在面积最大时所对应的区域,记为新对应区域;根据新对应区域中像素点的灰度值获得特征矩阵,根据特征矩阵获得对应的若干个独立分量序列;将同一个对应区域集的新对应区域所对应若干个独立分量序列所形成的集合,记为独立分量集合;将任意独立分量集合中每个独立分量序列作为节点,将任意两个节点对应的独立分量序列的余弦相似度,作为节点之间所形成边的边值,利用获得的节点、节点值、边以及边值构建图结构;对图结构进行多次聚类,将每次聚类获得的聚类簇记为聚类类别,将任意一次聚类下所有聚类类别的集合记为聚类类别集,根据聚类类别中的独立分量序列获得对应的若干个特征向量;根据聚类类别中所有独立分量序列的特征向量之间的余弦相似度的均值,获得聚类类别的分离度;在任意一次聚类下,根据聚类类别的分离度获得聚类类别集对应的分离性,将最大分离性对应的聚类类别集所包含聚类类别的数量记为独立分量数量;将独立分量数量作为ICA算法的分解数量参数,对舞蹈教学图像进行分解,根据得到每个舞蹈教学图像中各个舞蹈动作对应的独立分量序列实现舞蹈教学和指导。2.根据权利要求1所述基于多媒体舞蹈动作图像分解处理方法,其特征在于,所述新对应区域,获取方法如下:步骤(1),获取训练好的MaskR

CNN神经网络:首先,获取大量的舞蹈教学图像,将头部、左胳膊、右胳膊、左腿以及右腿作为人工标签,通过人工标注的方法,将每一个舞蹈教学图像中人体的各个身体部位进行标注,将每一个带有各个身体部位标签的舞蹈教学图像都作为一个样本,则由大量样本构成训练MaskR

CNN神经网络的数据集;然后,根据数据集结合交叉熵损失函数对MaskR

CNN神经网络进行训练,获得训练好的MaskR

CNN神经网络;步骤(2),将同一个动作下对应的动作图像集中,不同视角下的舞蹈教学图像所对应的相同标签区域作为对应区域,获取每个对应区域的最小外接矩形的面积,保持矩形中心不变,将多个舞蹈教学图像中同一个身体部位的最大面积的最小外接矩形,作为其他舞蹈教学图像中对应区域的最小外接矩形,将获得新的对应区域,记为新对应区域。3.根据权利要求1所述基于多媒体舞蹈动作图像分解处理方法,其特征在于,所述根据新对应区域中像素点的灰度值获得特征矩阵,根据特征矩阵获得对应的若干个独立分量序列,包括的具体步骤如下:获取舞蹈教学图像中每个新对应区域的每一行像素点的灰度值,按照像素点...

【专利技术属性】
技术研发人员:李杉杉
申请(专利权)人:长春医学高等专科学校长春职工医科大学长春市医学情报所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1