一种面向含缺失数据的手势动作分类方法技术

技术编号:33707722 阅读:21 留言:0更新日期:2022-06-06 08:33
本发明专利技术公开了一种面向含缺失数据的手势动作分类方法,过程如下:获取含缺失数据的手势动作数据集,依据缺失信息将其划分为观察值集和缺失值集;利用观察值集中每一列变量的均值对缺失值集进行预填补;基于预填补的数据,训练一个基于类别感知最优运输神经网络的手势动作分类器;利用手势动作分类器对预填补数据中的观察值进行重构,隐式地利用分类器的类别感知信息对缺失值进行填补;同时,采用最优运输理论减少同类别手势动作数据分布距离,显式地利用类别感知信息对缺失值进行填补;将填补后的数据作为感知机的输入,并最终输出分类结果。本发明专利技术将类别感知和最优运输理论应用于含缺失数据的手势动作分类领域,有效提高了分类的准确率和效率。类的准确率和效率。类的准确率和效率。

【技术实现步骤摘要】
一种面向含缺失数据的手势动作分类方法


[0001]本专利技术涉及数据挖掘和机器学习
,具体涉及一种面向含缺失数据的手势动作分类方法。

技术介绍

[0002]手势动作分类是人机交互技术的重要基础,也是相关智能设备和工业领域中不可忽视的技术。然而,由于传感器故障、障碍物阻挡和操作失误等,导致实际采集获取的手势动作数据常常包含缺失值。与此同时,已有的手势动作分类方法往往是基于数据是完整的假设,难以合理地对含缺失数据的手势动作执行分类。因此,设计面向含缺失数据的手势动作分类方法具有重要的意义。
[0003]现有的处理含缺失数据的手势动作分类方法可以简单地分为两类:直接删除包含缺失值的数据和先对缺失数据进行填补然后执行分类的方法。直接删除包含缺失值的手势动作数据容易导致观察值信息的丢失,特别是当缺失率比较高的时候。此外,在现实复杂场景中,采集的每条数据均可能不同程度都会包含缺失值,从而导致完整的数据数量极少。采用零、均值和最近邻等方法先对包含缺失值得手势动作数据进行填补,然后进行手势动作分类方法是现有方法的常见策略。然而,手势动作数据的填补和分类的过程是独立的,并且填补的过程往往是基于无监督的设定,导致填补的缺失值不可避免地引入了分类错误。

技术实现思路

[0004]本专利技术的目的是为了解决现有技术中的上述缺陷,提供一种面向含缺失数据的手势动作分类方法,该方法设计了一种基于类别感知最优运输的神经网络,在网络训练过程中采用分类器的类别感知信息对缺失数据进行填补,从而降低填补到分类的偏差。同时,为了使得填补的值更加适合分类,本专利技术采用最优运输理论来降低同类手势动作数据分布的差异,促使填补后的同类数据分布更加相似。
[0005]本专利技术的目的可以通过采取如下技术方案达到:
[0006]一种面向含缺失数据的手势动作分类方法,所述手势动作分类方法包括以下步骤:
[0007]S1、获取含缺失数据的手势动作数据集,依据缺失信息将其划分为观察值集和缺失值集;
[0008]S2、利用观察值集中每一列变量的均值对缺失值集中每一列变量进行预填补,得到预填补的完整数据集;
[0009]S3、基于预填补的完整数据集,训练一个基于类别感知最优运输神经网络的手势动作分类器,所述手势动作分类器包括一个基于类别感知最优运输的填补模块和一个基于感知机的分类模块;
[0010]S4、在所述基于类别感知最优运输的填补模块中对预填补数据中的观察值进行重构,并隐式地利用基于感知机的分类模块中的类别感知信息对缺失值进行填补;
[0011]S5、采用最优运输理论减少从同类别内随机选取的两组数据分布距离,使得同类数据分布相似,显式地利用手势动作类别感知信息对缺失值进行填补;
[0012]S6、将经过基于类别感知最优运输的填补模块填补后的完整数据作为基于感知机的分类模块的输入,训练类别感知最优运输神经网络,并将含缺失数据的测试集作为训练好的类别感知最优运输神经网络的输入,输出最终的手势动作分类结果。
[0013]进一步地,所述步骤S1过程如下:
[0014]S11、获取含缺失数据的手势动作数据集Z,表示为其中Y
n
表示第n个样本X
n
的标签,n的取值范围为[1,N],N为数据集Z中包含的样本总数,第n个样本X
n
表示为(x1,x2,null,

,x
d
,

,x
D
),其中null表示缺失值,x
d
表示第d个变量,d的取值范围为[1,D],在现实生活场景中采集得到的手势动作数据集Z,样本X
n
中至少都会包含一个值为null的变量;
[0015]S12、依据数据集Z中每个样本X
n
中标记为null的缺失信息,数据集Z中所有样本包含的缺失信息定义为一个N行D列的掩码矩阵M∈{m
nd
}
N
×
D
,m
nd
的取值为1或者0,如果m
nd
等于1表示样本X
n
的第d个变量x
d
为缺失值,m
nd
等于0表示为观察值,依据掩码矩阵M中m
nd
值全为0的对应样本的变量划分为观察值集,将m
nd
值全为1的对应样本的变量划分为缺失值集。对观察值集中同一列变量进行归一化处理,减少异常数值和噪声数值对整体数据分布的影响。
[0016]进一步地,所述步骤S2过程如下:
[0017]S21、利用步骤S12中获取的观察值集,计算观察值集中所有样本同列变量数值的均值,得到一个长度为D的数组B,数组B中的每一个元素表示对应变量所在列的均值;
[0018]S22、利用步骤S21中获取的数组B对步骤S12中获取的缺失值集进行均值预填补,采用数组B中所在列对应的值对缺失值集中所有样本对应列变量值为null的变量进行预填补,将经过预填补后的缺失值集和观察值集合并得到预填补的完整数据集。
[0019]进一步地,所述步骤S3过程如下:
[0020]利用步骤S22中得到的预填补的完整数据集,训练一个基于类别感知最优运输神经网络的手势动作分类器,采用基于类别感知最优运输的填补模块执行缺失值填补任务优化的同时,将上述填补模块得到的完整数据输入到基于感知机的分类模块进行分类训练,实现对包含缺失值数据的填补任务和分类任务的联合优化,隐式地利用分类模块的类别感知信息对填补任务进行优化,降低填补数值引入的分类错误率;其中,所述基于类别感知最优运输的填补模块包括三层全连接神经网络,分别是输入层、隐藏层和输出层,输入层和输出层的维度设定为手势动作数据的变量数,隐藏层的维度为手势动作数据变量数的两倍,输出层对缺失值位置的变量进行填补;所述基于感知机的分类模块由三层神经网络组成,其输入数据是基于类别感知最优运输的填补模块执行缺失值填补后的完整数据。
[0021]进一步地,所述步骤S4过程如下:
[0022]S41、在所述基于类别感知最优运输的填补模块的输入层与输出层中观察值位置构建一对一的映射关系,对观察值进行重构,促使输出层在缺失位置得到的填补值获取观察值的分布信息,映射关系定义如下:
[0023][0024]其中,表示全1的行向量,

表示向量间的元素积,其中样本表示经过步骤S22中均值预填补的数据,表示所述基于类别感知最优运输的填补模块中输入层的输入值,X
imp
表示所述基于类别感知最优运输的填补模块中输出层的输出值,m
n
表示步骤S12中定义的缺失掩码矩阵M中的一个行向量,表示样本的缺失掩码信息;
[0025]S42、对X
imp
中观察值位置的变量,采用经过均值预填补的数据中观察值变量对X
imp
中对应观察值位置的数值进行替换,获取对含缺失值数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向含缺失数据的手势动作分类方法,其特征在于,所述手势动作分类方法包括以下步骤:S1、获取含缺失数据的手势动作数据集,依据缺失信息将其划分为观察值集和缺失值集;S2、利用观察值集中每一列变量的均值对缺失值集中每一列变量进行预填补,得到预填补的完整数据集;S3、基于预填补的完整数据集,训练一个基于类别感知最优运输神经网络的手势动作分类器,所述手势动作分类器包括一个基于类别感知最优运输的填补模块和一个基于感知机的分类模块;S4、在所述基于类别感知最优运输的填补模块中对预填补数据中的观察值进行重构,并隐式地利用基于感知机的分类模块中的类别感知信息对缺失值进行填补;S5、采用最优运输理论减少从同类别内随机选取的两组数据分布距离,使得同类数据分布相似,显式地利用手势动作类别感知信息对缺失值进行填补;S6、将经过基于类别感知最优运输的填补模块填补后的完整数据作为基于感知机的分类模块的输入,训练类别感知最优运输神经网络,并将含缺失数据的测试集作为训练好的类别感知最优运输神经网络的输入,输出最终的手势动作分类结果。2.根据权利要求1所述的面向含缺失数据的手势动作分类方法,其特征在于,所述步骤S1过程如下:S11、获取含缺失数据的手势动作数据集Z,表示为其中Y
n
表示第n个样本X
n
的标签,N为数据集Z中包含的样本总数,第n个样本X
n
表示为(x1,x2,null,...,x
d
,...,x
D
),其中null表示缺失值,x
d
表示第d个变量,d的取值范围为[1,D],D为样本X
n
包含的变量总数;S12、依据数据集Z中每个样本X
n
中标记为null的缺失信息,数据集Z中所有样本包含的缺失信息定义为一个N行D列的掩码矩阵M∈{m
nd
}
N
×
D
,m
nd
的取值为1或者0,如果m
nd
等于1表示样本X
n
的第d个变量x
d
为缺失值,m
nd
等于0表示为观察值,依据掩码矩阵M中m
nd
值全为0的对应样本的变量划分为观察值集,将m
nd
值全为1的对应样本的变量划分为缺失值集。3.根据权利要求2所述的面向含缺失数据的手势动作分类方法,其特征在于,所述步骤S2过程如下:S21、利用步骤S12中获取的观察值集,计算观察值集中所有样本同列变量数值的均值,得到一个长度为D的数组B,数组B中的每一个元素表示对应变量所在列的均值;S22、利用步骤S21中获取的数组B对步骤S12中获取的缺失值集进行均值预填补,采用数组B中所在列对应的值对缺失值集中所有样本对应列变量值为null的变量进行预填补。4.根据权利要求3所述的面向含缺失数据的手势动作分类方法,其特征在于,所述步骤S3过程如下:利用步骤S22中得到的预填补的完整数据集,训练一个基于类别感知最优运输神经网络的手势动作分类器,采用基于类别感知最优运输的填补模块执行缺失值填补任务优化的同时,将上述填补模块得到的完整数据输入到基于感知机的分类模块进行分类训练,实现对包含缺失值数据的填补任务和分类任务的联合优化;其中,所述基于类别感知最优运输
的填补模块包括三层全连接神经网络,分别是输入层、隐藏层和输出层,输入层和输出层的维度设定为手势动作数据的变量数,隐藏层的维度为手势动作数据变量数的两倍,输出层对缺失值位置的变量进行填补;所述基于感知机的分类模块由三层神经网络组成,其输入数据是基于类别感知最优运输的填补模块执行缺失值填补后的完整数据。5.根据权利要求4所述的面向含缺失数据的手势动作分类方法,其特征在于,所述步骤S4过程如下:S41、在所述基于类别感知最优运输的填补模块的输入层与输出层中观察值位置构建一对一的映射关系,对观察值进行重构,促使输出层...

【专利技术属性】
技术研发人员:马千里柳真
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1