本发明专利技术公开了一种用于运动行为、关系识别的数据分析方法、电子设备,首先,通过移动端设置的多传感器收集运动数据构成初始数据集;其次,基于时间序列分析方法对初始数据集中的数据进行预处理,得到时序特征数据集;其次,分析时序特征数据集,得到用于模型构建的精细特征;其次,基于提取的精细特征建立运动身份识别模型和运动模式分析模型;最后,对运动身份识别模型中的特征进行合理的数学分析、解释得到和运动风格有关的一组运动特征;结合所述运动特征对每个用户进行分析,构造一组和用户对应的用户特征,可以利用用户的运动特征分析不同用户的跑步风格。结合运动身份预测模型和用户的运动特征判断用户间是否存在代跑等作弊行为,利用运动模式预测模型判断用户跑步时是否使用了交通工具等作弊行为。
【技术实现步骤摘要】
一种用于运动行为、关系识别的数据分析方法、电子设备
本专利技术涉及数据分析
,更具体地说,涉及一种用于运动行为、关系识别的数据分析方法、电子设备。
技术介绍
人工智能界认为机器学习是人工智能领域中最能体现智能的一个分支之一。它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。机器学习所研究的主要内容是关于计算机上从数据中产生模型的算法。将经验数据提供给它,它就能通过这些数据产生模型。在面临新的情况发生时,模型就能够提供给相应的判断。随机森林是一类常见的机器学习算法,是一个包含了多棵多个决策树的分类器。它的优点有:适用于耦合多维变量的问题,能够处理高维数据和多重共线性数据;对异常值和噪声容忍度高,模型不易出现过拟合现象,能够得到较高的模拟精度;在决定类别时,它能够评估变数的重要性等。现今,相关的理论和技术均以完善。在充足数据集的支持下,利用机器学习的随机森林方法能够较好解决各种分类问题。然而,如今许多高校通过“步道乐跑”、“运动世界校园”等手机APP督促学生课外体育锻炼,但因各种软件为了对学生的运动行为模式进行识别,所提出的算法和模型均缺乏有效性,导致代跑和骑行等作弊情况大量发生。目前利用手机APP进行运动作弊的研究较少,且目前国内外对于利用多传感器识别运动行为模式的分析较少,大多都仅停留在少数传感器上,没有对于多传感器的预测分析提供一个有效的方法或成果。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术对于利用多传感器识别运动行为模式的分析较少,大多都仅停留在少数传感器上,无法得出准确的分析结果的缺陷,提供一种用于运动行为、关系识别的数据分析方法、电子设备。本专利技术解决其技术问题所采用的技术方案是:构造一种用于运动行为识别的数据分析方法,包括以下步骤:S1、获取用于反映用户运动行为的初始数据集;S2、针对初始数据集中的每项数据,基于时间序列分析方法进行预处理,提取出每项数据的时序特征,构建第一时序特征数据集;S3、基于所述第一时序特征数据集,利用机器学习分类算法进行数据分类和初始运动模式分析模型构建后,分析每项分类特征对当前建模模型精确率的影响程度,根据影响程度的大小对所述第一时序特征数据集进行筛除;随后,基于当前筛选所得的第二时序特征数据集进行运动模式分析模型和运动身份识别模型的构建;S4、将待识别运动行为的数据输入到步骤S3构建的运动模式分析模型和运动身份识别模型后,基于运动身份识别模型进行用户身份识别,基于运动模式分析模型进行对应用户运动行为识别。本专利技术为解决其技术问题所采用的另外一种技术方案是:构造一种用于运动行为识别的数据分析方法,包括在移动端设置若干个用于监测运动行为数据的传感器;将传感器监测到的数据通过有线或无线网络传输协议传输到服务端后,执执行如上述的用于运动行为识别的数据分析方法,实现对应用户运动行为的识别。本专利技术公开的一种根据上述用于运动行为识别的数据分析方法,实现运动关系识别的数据分析方法,具体的,在步骤S4之后,还包括:S5、对第二时序特征数据集中用于构建运动身份识别模型的分类特征进行数学分析,并结合实际的运动场景,将上述分类特征解释成和运动风格相关的运动特征;S6、利用运动身份预测模型并结合基于步骤S5所得的若干项运动特征,进行不同用户间的运动关系识别。本专利技术公开的一种电子设备,包括存储器和处理器,其中:所述存储器,用于存储有上述任一项所述的用于运动行为识别的数据分析方法、如上述的用于运动行为识别的数据分析方法、以及如上述的用于运动关系识别的数据分析方法中的任意一种或者多种方法所对应的计算机可执行指令;所述处理器,用于调用和/或执行存储于所述存储器的计算机可执行指令。在本专利技术所述的一种用于运动行为、关系识别的数据分析方法、电子设备中,构建了运动模式分析模型和运动身份识别模型,对运动人员的身份及运动方式进行了预测分析,并对其运动风格以用户特征的形式进行了合理性解释。实施本专利技术的一种用于运动行为、关系识别的数据分析方法、电子设备,具有以下有益效果:从宏观角度对用户的运动行为进行了即时的分析,有效地预测了运动者的可能运动模式,并判断了是否存在代跑、骑行等作弊行为,可为智能健康硬件公司提供用户运动特征分析和运动模式识别的决策支持。提出了利用多传感器分析行为人运动行为模式的方法,并在检测中取得了较高的精度。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术一种用于运动行为、关系识别的数据分析方法流程图;图2是本专利技术模型构建过程的流程图;图3是本专利技术公开的一种电子设备结构图。具体实施方式为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。实施例1:为了结合应用软件对运动者的运动行为进行及时分析,请参考图1,其为本专利技术一种用于运动行为、关系识别的数据分析方法流程图,结合图1,在进行运动行为分析的时候,具体,包括以下步骤:S1、获取用于反映用户运动行为的初始数据集;所述初始数据集可以是先前已通过相关的数据监测设备监测到,并将其存储于移动或固定存储设备中,在需要获取到所述初始数据集的时候,只需从对应的存储设备中拷贝出即可;所述初始数据集还可以是通过即时传输的方式传输到处理终端,例如通过传感器进行监测数据的即时传输,由所述处理终端执行下一步骤。初始数据集每个数据由特征集和标签两大部分组成,其中,特征集指提取拷贝出的数据时序特征后组成数据特征集;标签分为两种情况,在运动模式分析模型中,标签指运动方式,在运动身份识别模型中,标签指用户的唯一身份。S2、针对初始数据集中的每项数据,基于时间序列分析方法进行预处理,提取出每项数据的时序特征,构建第一时序特征数据集;当前步骤下,所述时间序列分析方法是一种动态数据处理的统计方法,具体是对获取到的数据进行符号化处理,针对所得的符号化时序数据进行时序特征的提取,其中,提取到的符号化时序数据包括:均值、中值、标准差、归一化后的标准差、极差、峰度、偏度、突发性统计、变异系数、highlowmu统计、负对然似数、线性拟合均方根误差(RMSE)、二次拟合RMSE、三次拟合RMSE、去掉10%最大最小值后的均值、定制偏度测量、起始点到首个波峰的距离、起始点到首个波峰的面积、起始点到首个波峰的曲线长度、起始点到波峰之后首个波谷的距离、起始点到波峰之后首个波谷的面积、起始点到波峰之后首个波谷的曲线长度、起始点到最大波峰的距离、起始点到最大波峰的面积、起始点到最大波峰的曲线长度、起始点到波峰之后最大波谷的距离、起始点到波峰之后最大波谷的面积、起始点到波峰之后最大波谷的曲线长度、香农熵、近似熵共30个特征。S3、基于所述第一时序特征数据集,利用机器学习分类算法进行数据分类和初始运动模式分析模型构建后,分析每项分类特征对当前建模模型精确率的影本文档来自技高网...
【技术保护点】
1.一种用于运动行为识别的数据分析方法,其特征在于,包括以下步骤:/nS1、获取用于反映用户运动行为的初始数据集;/nS2、针对初始数据集中的每项数据,基于时间序列分析方法进行预处理,提取出每项数据的时序特征,构建第一时序特征数据集;/nS3、基于所述第一时序特征数据集,利用机器学习分类算法进行数据分类和初始运动模式分析模型构建后,分析每项分类特征对当前建模模型精确率的影响程度,根据影响程度的大小对所述第一时序特征数据集进行筛除;随后,基于当前筛选所得的第二时序特征数据集进行运动模式分析模型和运动身份识别模型的构建;/nS4、将待识别运动行为的数据输入到步骤S3构建的运动模式分析模型和运动身份识别模型后,基于运动身份识别模型进行用户身份识别,基于运动模式分析模型进行对应用户运动行为识别。/n
【技术特征摘要】
1.一种用于运动行为识别的数据分析方法,其特征在于,包括以下步骤:
S1、获取用于反映用户运动行为的初始数据集;
S2、针对初始数据集中的每项数据,基于时间序列分析方法进行预处理,提取出每项数据的时序特征,构建第一时序特征数据集;
S3、基于所述第一时序特征数据集,利用机器学习分类算法进行数据分类和初始运动模式分析模型构建后,分析每项分类特征对当前建模模型精确率的影响程度,根据影响程度的大小对所述第一时序特征数据集进行筛除;随后,基于当前筛选所得的第二时序特征数据集进行运动模式分析模型和运动身份识别模型的构建;
S4、将待识别运动行为的数据输入到步骤S3构建的运动模式分析模型和运动身份识别模型后,基于运动身份识别模型进行用户身份识别,基于运动模式分析模型进行对应用户运动行为识别。
2.根据权利要求1所述的用于运动行为识别的数据分析方法,其特征在于,步骤S2中,所述时间序列分析方法是对获取到的数据进行符号化处理,针对所得的符号化时序数据进行时序特征的提取。
3.根据权利要求1所述的用于运动行为识别的数据分析方法,其特征在于,步骤S3中,采用随机森林算法对第一、二时序特征数据集中的每项数据进行建模,得到初始运动模式分析模型和运动身份识别模型。
4.根据权利要求1所述的用于运动行为识别的数据分析方法,其特征在于,步骤S3中,根据每项分类特征对当前建模模型精确率的影响程度,按照影响程度的大小,分析第一时序特征数据集中每项时序特征在所述初始运动模式分析模型所占的权重值αi,i=1,...,M,M为时序特征的总数量;
将每项时序特征的权重值αi与预设的权重阈值β进行比较,选择权重值αi大于β的时序特征,组成第二时序特征数据集。
5.根据权利要求4所述的用于运动行为识别的数据分析方法,其特征在于,采用平均精度减小法分析每项时序特征在所述初始运动模式分析模型中所占的权重αi,其中:
给每项时序特征加入随机噪声;
度量加入随机噪声前、后的时序特征对初始运动模式分析模型精确率的...
【专利技术属性】
技术研发人员:姚尧,刘子奇,王卓伦,尹瀚玙,郭紫锦,
申请(专利权)人:中国地质大学武汉,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。