一种深蹲动作识别方法技术

技术编号:28421978 阅读:23 留言:0更新日期:2021-05-11 18:29
本发明专利技术涉及深度学习与模式识别领域,具体是一种深蹲动作识别方法,具体步骤为:S1、数据提取;S2、输入数据;S3、数据预处理;S4、训练卷积神经网络;S5、计算初始概率;S6、计算转移概率;S7、使用维特比算法重新分类;S8、算法性能评估;本发明专利技术使用惯导式动作捕捉设备提取数据,在卷积神经网络CNN的基础上进行深度开发,提出一种基于CNN的新型算法,并将该方法应用于深蹲运动的动作识别实验,实验结果表明,该方法可以正确区分深蹲运动中标准蹲姿与非标准蹲姿,相比于CNN,该方法具有较高的识别准确率。

【技术实现步骤摘要】
一种深蹲动作识别方法
本专利技术涉及深度学习与模式识别领域,具体是一种深蹲动作识别方法。
技术介绍
近年来,使用端到端的深度学习程序训练的神经网络因解决各种复杂机器学习问题而备受关注。人体动作识别技术被认为是计算机视觉中广为人知的研究主题之一,对于理解和分析人类活动至关重要,通过与多种设备相结合,现已服务于从视觉监视到人机交互系统的诸多应用领域。深蹲是一项健身运动,是改善健康和增强肌肉的最常见运动之一,它几乎牵涉到身体的每一块肌肉,由于其动作的复合性和全身性而深受广大健身爱好者欢迎。但是,大多数人在进行训练时通常由于不良习惯或训练时遇到障碍等并不能完成标准的深蹲动作,错误地进行深蹲练习会造成潜在的伤害,对人们来说,通过训练执行锻炼中的通用标准模式非常重要,当人们深蹲训练动作不标准时,应向他们提出警告,避免运动中受伤。
技术实现思路
为了解决上述问题,本专利技术提出一种深蹲动作识别方法。一种深蹲动作识别方法,其具体步骤如下:S1、数据提取:下蹲需要4秒,传感器的捕获速度为100帧/秒,因此数据序列的长度为450帧,共设有6种深蹲模式;S2、输入数据:实验中共使用8个感知神经元的传感器,每个感知神经元产生的计算数据为12列,随后,在训练数据的第1列增加不同动作模式的序列,分别记为0,1,2,3,4,5,作为机器学习中监督学习的标签,其余96列数据作为机器学习的训练数据,则输入数据尺寸大小为97×135000;S3、预处理:a、数据标准化:在训练数据经卷积神经网络CNN训练前,根据公式1-1对数据进行标准化:其中,X是单个特征的值,μ是平均值,而σ是X的标准偏差;b、数据分割处理:对输入数据做窗口分割处理,将每个窗口大小划分为96×450;S4、训练CNN:在对输入数据预处理后开始训练卷积神经网络,卷积神经网络结构一共包含7层,具体说明如下:a、第一层,卷积层,本层输入矩阵大小为96×450×1,卷积核为一维滤波器,尺寸大小为1×12,深度为46,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为46×439×46;b、第二层,池化层,本层输入矩阵大小为46×439×46,池化方法为最大化池化,卷积核为一维滤波器,卷积核尺寸大小为1×10,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为46×86×46;c、第三层,卷积层,本层输入矩阵大小为46×86×46,卷积核为一维滤波器,卷积核尺寸大小为1×6,深度为23,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为23×81×23;d、第四层,池化层,本层输入矩阵大小为23×81×23,池化方法为最大化池化,卷积核为一维滤波器,卷积核尺寸大小为1×3,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为16×23×23。第四层的输出被转换成一维数组,并连接到神经网络中的每个神经元;e、第五层,全连接层Ⅰ,本层输入矩阵大小为16×23×23=8464,共8464个神经元节点,使用的激活函数是ReLU函数;f、第六层,全连接层Ⅱ,本层输入矩阵大小为1×8464,并对隐藏节点做dropout机制处理,保持其丢弃概率为50%,输出神经元规模为1×1000,共1000个神经元节点;g、第七层,softmax层,本层在全连接层Ⅱ之后,增加softmax函数,连接到6个输出节点,每个节点代表一个深蹲模式,本层输出为后验概率P(S|X),其中,S为未知深蹲序列,X为输入数据序列;S5、计算初始概率;S6、计算转移概率;S7、使用维特比算法重新分类:在卷积神经网络训练完成后,使用维特比算法对深蹲序列重新分类,具体步骤如下:a、根据贝叶斯决策规则,将卷积神经网络中得到的后验概率P(S|X)表示为公式1-2;b、对给定样本X,证据因子P(X)与类标记无关,因此,后验概率P(S|X)表示为类先验概率P(S)和类条件概率密度P(X|S)的乘积。P(S|X)=P(X|S)P(S)(公式1-3);c、考虑到输入的时间变化,采用一阶马尔可夫假设,将P(X|S)最大化,如公式1-4中,P(st|st-1)为6种深蹲动作之间的转移概率,P(xt|st)为公式1-2中类条件概率密度函数;d、再次使用贝叶斯决策规则将P(xt|st)转化为似然度:e、使用维特比算法对深蹲状态序列重新分类,求出最有可能的识别序列f、联立公式1-2、公式1-3、公式1-4、公式1-5、公式1-6,得到最终深蹲动作识别公式1-7:S8、算法性能评估:通过使用三种不同的指标:准确率(Accuracy),灵敏度(Sensitivity)和特异性(Specificity)进行评估,公式如下:所述的步骤S1的实验中,选择8个感知神经元节点用于本实验,分别放置在身体脊椎、臀部、左腿、左脚、右腿、右脚,其中在左腿和右腿处分别在膝盖上侧和下侧安装两个感知神经元的传感器。所述的步骤S5中,6种深蹲模式初始概率均匀分布,均为1/6。所述的步骤S6中,转移概率使用公式计算,其中,kij为状态i到状态j状态转移的次数,N是不同状态的数量,N=6。所述的步骤S7-a中,对于公式1-2,P(S)是类先验概率;P(X|S)为S关于X的似然函数,也称类条件概率密度函数;P(X)为用于归一化的证据因子,其目的在于保证各类别后验概率总和为1;所述的步骤S7-c中,对于公式1-4,将P(X|S)最大化,其目的在于将识别错误率降至最低。所述的步骤S7-d中,对于公式1-5中P(st)表示深蹲模式状态之间的转移次数,P(xt)为常数,得到S7-f中公式1-7为最佳识别序列。本专利技术的有益效果是:针对现有动作识别系统多采用光学式动捕设备,价格昂贵且对环境要求较高,易受到强光、遮挡和失真类条件限制的弊端,本专利技术使用惯导式动作捕捉设备,提出一种基于卷积神经网络CNN的新型算法,该算法在CNN的基础上进行深度开发,并将该算法应用于深蹲运动的动作识别实验,实验结果表明,该方法可以正确区分深蹲运动中标准蹲姿与非标准蹲姿,相比于卷积神经网络,该新型算法具有较高的识别准确率。附图说明下面结合附图和实施例对本专利技术进一步说明。图1为本专利技术的流程结构示意图;图2为本专利技术的混淆矩阵结构示意图;图3为本专利技术的卷积神经网络结构示意图;图4为本专利技术的算法模型结构示意图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面对本专利技术进一步阐述。如图1至图4所示,一种深蹲动作识别方法,其具体步骤如下:S1、数据提取:下蹲需要4秒,传感器的捕获速度为100帧/秒,因此数据序列的长度为450帧,共设有6种深蹲模式本文档来自技高网...

【技术保护点】
1.一种深蹲动作识别方法,其特征在于:其具体步骤如下:/nS1、数据提取:下蹲需要4秒,传感器的捕获速度为100帧/秒,因此数据序列的长度为450帧,共设有6种深蹲模式;/nS2、输入数据:实验中共使用8个感知神经元的传感器,每个感知神经元产生的计算数据为12列,随后,在训练数据的第1列增加不同动作模式的序列,分别记为0,1,2,3,4,5,作为机器学习中监督学习的标签,其余96列数据作为机器学习的训练数据,则输入数据尺寸大小为97×135000;/nS3、预处理:/na、数据标准化:在训练数据经卷积神经网络CNN训练前,根据公式1-1对数据进行标准化:/n

【技术特征摘要】
1.一种深蹲动作识别方法,其特征在于:其具体步骤如下:
S1、数据提取:下蹲需要4秒,传感器的捕获速度为100帧/秒,因此数据序列的长度为450帧,共设有6种深蹲模式;
S2、输入数据:实验中共使用8个感知神经元的传感器,每个感知神经元产生的计算数据为12列,随后,在训练数据的第1列增加不同动作模式的序列,分别记为0,1,2,3,4,5,作为机器学习中监督学习的标签,其余96列数据作为机器学习的训练数据,则输入数据尺寸大小为97×135000;
S3、预处理:
a、数据标准化:在训练数据经卷积神经网络CNN训练前,根据公式1-1对数据进行标准化:



其中,X是单个特征的值,μ是平均值,而σ是X的标准偏差;
b、数据分割处理:对输入数据做窗口分割处理,将每个窗口大小划分为96×450;
S4、训练CNN:在对输入数据预处理后开始训练卷积神经网络,卷积神经网络结构一共包含7层,具体说明如下:
a、第一层,卷积层,本层输入矩阵大小为96×450×1,卷积核为一维滤波器,尺寸大小为1×12,深度为46,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为46×439×46;
b、第二层,池化层,本层输入矩阵大小为46×439×46,池化方法为最大化池化,卷积核为一维滤波器,卷积核尺寸大小为1×10,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为46×86×46;
c、第三层,卷积层,本层输入矩阵大小为46×86×46,卷积核为一维滤波器,卷积核尺寸大小为1×6,深度为23,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为23×81×23;
d、第四层,池化层,本层输入矩阵大小为23×81×23,池化方法为最大化池化,卷积核为一维滤波器,卷积核尺寸大小为1×3,平移步长为5,使用的激活函数是ReLU函数,本层的输出矩阵大小为16×23×23;第四层的输出被转换成一维数组,并连接到神经网络中的每个神经元;
e、第五层,全连接层Ⅰ,本层输入矩阵大小为16×23×23=8464,共8464个神经元节点,使用的激活函数是ReLU函数;
f、第六层,全连接层Ⅱ,本层输入矩阵大小为1×8464,并对隐藏节点做dropout机制处理,保持其丢弃概率为50%,输出神经元规模为1×1000,共1000个神经元节点;
g、第七层,softmax层,本层在全连接层Ⅱ之后,增加softmax函数,连接到6个输出节点,每个节点代表一个深蹲模式,本层输出为后验概率P(S|X),其中,S为未知深蹲序列,X为输入数据序列;
S5、计算初始概率;
S6、计算转移概率;
S7、使用维特比算...

【专利技术属性】
技术研发人员:张振张师榕赵转哲刘永明阚延鹏叶国文付磊
申请(专利权)人:安徽工程大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1