基于均衡聚类的运动捕捉数据字符化表达方法技术

技术编号:18139021 阅读:97 留言:0更新日期:2018-06-06 12:12
本发明专利技术公开了一种基于均衡聚类的运动捕捉数据字符化表达方法,让用户方便地将高维时序数据转换为字符表达,从而有效进行后续的数据分析,首先采用分段聚集近似将运动捕捉数据(时序数据)分割成M分段,并计算各段的均值;采用均衡聚类算法将这M个分段的均值平均的聚集到K个类中;最后通过给每个类分配一个字符,从而原始运动捕捉数据就可以表达成字符序列,可以根据需要对M和K的值进行设置,从而获得符合应用需求的字符表达,从而最大化优化后续数据分析以及挖掘算法的效率,具有良好的应用前景。

【技术实现步骤摘要】
基于均衡聚类的运动捕捉数据字符化表达方法
本专利技术涉及计算机图形学
,具体涉及一种基于均衡聚类的运动捕捉数据字符化表达方法。
技术介绍
运动分析即是指通过分析运动捕捉数据,发现动作中人们感兴趣的信息。学者们可以更为有效地开展各方面运动分析技术的研究,这些研究涵盖了军事、体育、医疗、教育以及娱乐等诸多领域。然而,由于运动捕捉数据具有时序性,同字符数据相比,时序数据具有较高的复杂性,所以用于字符数据分析与挖掘的方法通常并不适用于时序数据。目前,很多分析方法都是基于穷举或者遍历来解决数据分析问题,具有较高的空间与时间复杂度。为了解决这个问题,加州大学的Eamonn和Jessica提出了将时序数据转换成字符数据的方法字符聚集近似(PiecewiseAggregateApproximation,SAX)。该方法,首先采用分段聚集近似将时序数据分割成等长的分段,之后用每个分段的均值来表示各个分段,之后根据高斯分布等概率线将这些均值划分到各个区间,使得每个区间中的均值数目基本相等,最后为每个区间分配一个字符,这样就获得了时序数据的字符表达。字符聚集近似的表示方法可以以较少的存储获得对原始时序数据准确的描述,因此被广泛应用于时序数据挖掘中。例如,重复模式发现,异常检测等。但是,SAX在低维时序数据中应用较为有效,当数据维度较大时,每一维度都会得到字符聚集近似表示,数据的复杂度依然很高,另外,针对每一维度得到字符聚集近似的操作也较为繁琐,有太多参数需要设置,使用极为不方便。如何克服上述的问题,是当前急需解决的。
技术实现思路
本专利技术的目的是克服现有的将时序数据转换成字符数据的字符聚集近似方法,所存在的问题。本专利技术的基于均衡聚类的运动捕捉数据字符化表达方法,让用户方便的将高维时序数据转换为字符表达,从而有效进行后续的数据分析;适用于对所有时序数据,具有一般性和通用性;可以保证以相同概率产生字符,从而最大化优化后续数据分析以及挖掘算法的效率,具有良好的应用前景。为了达到上述目的,本专利技术所采用的技术方案是:一种基于均衡聚类的运动捕捉数据字符化表达方法,包括以下步骤,步骤(A),加载运动捕捉数据库,加载过程中使用各个关节相对其父关节的三维转动信息,作为存储和处理的特征;步骤(B),采用分段聚集近似方法,对加载的运动捕捉数据进行分割,将其分割成若干段,并计算出每个段的均值,即均值为各段的中心,分段数的数量为M;步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量为K;步骤(D),给K个类分别分配一个独立的字符,属于该类的段内数据都取该字符作为表达,从而获得加载的运动捕捉数据的字符表达。前述的基于均衡聚类的运动捕捉数据字符化表达方法,步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量为K,包括以下步骤,(C1)采用KMeans++算法,选取K个初始类的类中心;(C2),计算各段的中心数据点到类中心的距离,形成M个中心数据点分配给K个类的分配问题,该分配问题可以分为两步解决,(C2.1),随机选取M个中心数据中的个分配到K个类中,采用匈牙利算法求解,分配结束后,更新各个类的类中心;(C2.2),完成(C2.1)的分配后,重新计算剩下的个数据点到K个更新后的类中心的距离,并采用匈牙利算法将他们分配到K个类中,分配结束后,再次更新各个类的类中心;(C3),重复(C2),直到各个类的类中心不再发生变化或者满足收敛要求。前述的基于均衡聚类的运动捕捉数据字符化表达方法,(C3),满足收敛要求,即相邻两次迭代的均方误差小于10-5。本专利技术的有益效果是:本专利技术的基于均衡聚类的运动捕捉数据字符化表达方法,让用户方便的将高维时序数据转换为字符表达,从而有效进行后续的数据分析;适用于对所有时序数据,具有一般性和通用性;可以保证以相同概率产生字符,从而最大化优化后续数据分析以及挖掘算法的效率,具有良好的应用前景。附图说明图1是本专利技术的基于均衡聚类的运动捕捉数据字符化表达方法的流程图;图2是本专利技术的运动捕捉数据分段聚集近似分割的示例图;图3是本专利技术的两类分配的第一示例图;图4是本专利技术的两类分配的第二示例图;图5是本专利技术的平衡聚类结果的示例图;图6是本专利技术的字符表达的示例图。具体实施方式下面将结合说明书附图,对本专利技术作进一步的说明。本专利技术的基于均衡聚类的运动捕捉数据字符化表达方法,可以让用户方便地将高维时序数据转换为字符表达,从而有效进行后续的数据分析,首先采用分段聚集近似将运动捕捉数据(时序数据)分割成M分段,并计算各段的均值;采用均衡聚类算法将这M个分段的均值平均的聚集到K个类中;最后通过给每个类分配一个字符,从而原始运动捕捉数据就可以表达成字符序列,可以根据需要对M和K的值进行设置,从而获得符合应用需求的字符表达,如图1所示,具体包括以下步骤,步骤(A),加载运动捕捉数据库,加载过程中使用各个关节相对其父关节的三维转动信息,作为存储和处理的特征;步骤(B),采用分段聚集近似方法,对加载的运动捕捉数据进行分割,将其分割成若干段,并计算出每个段的均值,即均值为各段的中心,分段数的数量为M;步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量为K,(C1)采用KMeans++算法,选取K个初始类的类中心;(C2),计算各段的中心数据点到类中心的距离,形成M个中心数据点分配给K个类的分配问题,该分配问题可以分为两步解决,(C2.1),随机选取M个中心数据中的个分配到K个类中,采用匈牙利算法求解,分配结束后,更新各个类的类中心;(C2.2),完成(C2.1)的分配后,重新计算剩下的个数据点到K个更新后的类中心的距离,并采用匈牙利算法将他们分配到K个类中,分配结束后,再次更新各个类的类中心;(C3),重复(C2),直到各个类的类中心不再发生变化或者满足收敛要求,满足收敛要求,即相邻两次迭代的均方误差小于10-5。步骤(D),给K个类分别分配一个独立的字符,属于该类的段内数据都取该字符作为表达,从而获得加载的运动捕捉数据的字符表达。本专利技术的基于均衡聚类的运动捕捉数据字符化表达方法,一个具体实施例,如图2所示,运动捕捉数据被分割成了5个分段,每段的均值即为该段的中心;采用均衡聚类方法将2个分段中心分到若干个类中,类数K为2个,均衡聚类算法如下:(1)首先采用KMeans++算法选取K个初始类中心;(2)计算各个分段的中心数据点到类中心的距离,形成M个数据点分配给K个类的分配问题,如图3所示,将5个分段的中心数据点中的4个分配给了2个类;(3)选取[M/K]*K个数据点分配给2个类,采用匈牙利算法解决,分配结束后,更新各个类中心,如图4所示,将剩余的1个分段的中心数据点分配给2个类;(4)上一步分配后,重新计算剩下的M-[M/K]*K个数据点到2个更新类中心的距离,并将它们分配到2个类中,分配结束后,再次更新类中心;(5)、重复执行上述步骤(2)、(3)、(4),直到类中心不再发生变化,或者满足收敛要求,如图5所示,5个分段运动捕捉数据被正确分成了2类;为两个类分别分配一个独立的字符,属于该类的段都取该字符作为表达,如图4所示,是运动捕捉数据的字符表达。综上所述,本专利技术的基于均本文档来自技高网...
基于均衡聚类的运动捕捉数据字符化表达方法

【技术保护点】
基于均衡聚类的运动捕捉数据字符化表达方法,其特征在于:包括以下步骤,步骤(A),加载运动捕捉数据库,加载过程中使用各个关节相对其父关节的三维转动信息,作为存储和处理的特征;步骤(B),采用分段聚集近似方法,对加载的运动捕捉数据进行分割,将其分割成若干段,并计算出每个段的均值,即均值为各段的中心,分段数的数量为M;步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量为K;步骤(D),给K个类分别分配一个独立的字符,属于该类的段内数据都取该字符作为表达,从而获得加载的运动捕捉数据的字符表达。

【技术特征摘要】
1.基于均衡聚类的运动捕捉数据字符化表达方法,其特征在于:包括以下步骤,步骤(A),加载运动捕捉数据库,加载过程中使用各个关节相对其父关节的三维转动信息,作为存储和处理的特征;步骤(B),采用分段聚集近似方法,对加载的运动捕捉数据进行分割,将其分割成若干段,并计算出每个段的均值,即均值为各段的中心,分段数的数量为M;步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量为K;步骤(D),给K个类分别分配一个独立的字符,属于该类的段内数据都取该字符作为表达,从而获得加载的运动捕捉数据的字符表达。2.根据权利要求1所述的基于均衡聚类的运动捕捉数据字符化表达方法,其特征在于:步骤(C),根据均衡聚类方法,将步骤(B)中的各段中心分到若干个类中,类的数量...

【专利技术属性】
技术研发人员:杨洋冯军
申请(专利权)人:江苏易乐网络科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1