当前位置: 首页 > 专利查询>浙江大学专利>正文

多变量拍类体育运动数据的可视分析方法和系统技术方案

技术编号:26222718 阅读:43 留言:0更新日期:2020-11-04 10:53
本发明专利技术涉及一种多变量拍类体育运动数据的可视分析方法和系统,属于拍类体育数据分析、事件序列可视化技术领域。包括:1)收集不同拍类体育运动项目的数据,并预处理为相同的数据格式,将每次击球表达为一个多属性事件;2)将每个回合表述为由若干多属性事件组成的序列,同一种体育项目中若干回合的数据组成一个数据集;3)对于某个回合,计算其对应的序列中使用特征子序列重构原序列的校正成本;4)以校正成本最低时使用的特征子序列作为可视化分析对象。通过使用特征挖掘的方法,从数以百计的回合中,发现球员的战术特征(一些频繁出现的击球特征子序列),并用可视化技术比较不同球员、球员在不同时间的表现。

【技术实现步骤摘要】
多变量拍类体育运动数据的可视分析方法和系统
本专利技术涉及拍类体育数据分析、事件序列可视化
,具体地说,涉及一种多变量拍类体育运动数据的可视分析方法和系统。
技术介绍
拍类体育指乒乓球、羽毛球、网球。这类体育运动有较大的相同之处,均有较强的竞技性,其数据也有较大的分析价值。拍类体育运动有一个类似的规则:每个回合均由一方球员发球开始,双方球员依次击球,直到一方胜出。这种规则非常符合事件序列:可以直观地将每次击球定义为一个事件;从发球到胜出的若干次击球事件组成一个序列。但目前并没有一种能够从事件序列的角度,对拍类体育数据进行有效的可视化分析的方法。尽管没有技术直接解决这一问题,但在拍类体育数据分析和事件序列可视化的领域均已有相关的研究。目前,拍类体育数据分析领域已有部分工作展开了各个角度的分析,如乒乓球中使用基于二阶马尔可夫链的模型对使用不同技战术结果进行预测,网球中分解球的二维坐标从而进行更清晰的可视化分析等。而事件序列可视化也在众多方向进行了研究,例如基于流图(FlowChart)的可视化可以分析事件发展趋势、基于矩阵(Matrix)的可视化可以发现事件之间的关联、投影散点图(ScatterplotsforProjection)的可视化可以从全局的角度发现序列之间的特征等等。拍类体育运动中,每一拍都需要综合多个属性进行描述。如乒乓球中关注球员的站位、球在球桌上的落点、击球的技术、球的旋转方向等;羽毛球中关注球的高度、击球的技术、双方球员的位置等等。因此,拍类体育数据是多变量的。现有的事件序列分析方法难以处理这样的数据。首先,特征挖掘需要综合考虑多个属性。例如,乒乓球中,最重要的属性是球的技术,其次是球的落点,而旋转的重要性很低;而网球有所不同,最重要的是球的落点,其次是球员的位置。挖掘特征时,不同属性需要赋予不同的权重,这样挖掘出的特征才能具有较大的研究价值。其次,特征挖掘需要考虑每个属性中不同值的相似性。例如,乒乓球击球技术中,快攻与弧圈是非常相似的两种技术。因此,挖掘特征时,如果整体特征类似,两者的差异可以被忽略。最后,同时展示多个不同的属性对于可视化领域是比较有挑战的,因为信息量较大容易造成视觉混乱,让用户难以浏览数据,获取信息。此外,由于拍类体育运动的高竞技性,运动员往往需要变换自己的策略,防止遭到对手的针对。这也为现有的事件序列特征挖掘方法、可视化方法带来了新的挑战。首先,常见的频繁序列特征挖掘方法由于是基于特征出现的次数,所以很难发掘出运动员的杀手锏(出现次数少,但关键时刻效果好)。其次,需要对比不同运动员的战术特征,以及运动员在不同时刻的战术特征选择。对比是可视化领域常见的问题,但因为需要同时对比多个属性,已有的方法不能直接应用到拍类体育数据中。
技术实现思路
本专利技术的目的是提供一种多变量拍类体育运动数据的可视分析方法和系统,从事件序列的角度,对拍类体育运动进行分析,可以同时对比多个属性。为了实现上述目的,第一方面,本专利技术提供的多变量拍类体育运动数据的可视分析方法包括以下步骤:1)收集不同拍类体育运动项目的数据,并预处理为相同的数据格式,将每次击球表达为一个多属性事件;2)将每个回合表述为由若干多属性事件组成的序列,同一种体育项目中若干回合的数据组成一个数据集;3)对于某个回合,计算其对应的序列中使用特征子序列重构原序列的校正成本;4)以校正成本最低时使用的特征子序列作为可视化分析对象。上述技术方案中,通过使用特征挖掘的方法,从数以百计的回合中,发现球员的战术特征(一些频繁出现的击球特征子序列),并用可视化技术比较不同球员、球员在不同时间的表现。所述的数据包括球位置、球员位置、球员所使用的技术种类、球速、旋转方向、持拍方式等多种数据。所述的多属性事件表示为e={a1=v1,a2=v2,...,ai=vi,...},所述的序列表示为S=(e1,e2,e3,...,en),同时每个回合会记录发球方、胜出方以及局号信息。步骤3)中,通过以下方法计算校正成本:3-1)遍历该回合中每一个属性,并单独计算每个属性的校正成本;3-2)对于每个属性ai,分别提取原序列和特征子序列中每个事件的第i个属性值,构成单变量的序列Si和单变量的特征子序列Pi;3-3)计算Si和Pi的最长公共子序列lcs,其中,相似的属性值视为序列与特征子序列的公共部分;3-4)计算lcs在Si和Pi中的占位长度,即从lcs开始到lcs结束,序列中经历的事件个数,分别记为spanS和spanP;3-5)定义三个可调节的参数,分别是通过限制增加事件,从而控制特征序列长度的costins;通过限制删除事件,从而控制特征序列真实性的costdel;以及通过限制不连续事件,从而控制序列连续性的costcon;3-6)计算从Si到lcs的校正成本ΔLi1=(len(Si)-len(lcs))×costins+(spanS-len(lcs))×costcon,其中len()函数用于计算序列长度;3-7)计算从lcs到Pi的校正成本ΔLi2=(len(Pi)-len(lcs))×costdel+(spanP-len(lcs))×costcon;3-8)加和步骤3-6)与步骤3-7)中的两项校正成本,获得单属性的校正成本ΔLi=ΔLi1+ΔLi2;3-9)有权加和每个属性的校正成本作为基于特征子序列重构原序列的校正成本。将相似的属性值归为一组,并在挖掘特征时,将一组的属性值视为相同;在属性ai中,所有可能的值会且只会被归为一组。将属性分为类别型与数值型,类别型属性的分组中,每一组均为离散的类别;数值型属性的分组中,每一组是一段数值区间。第二方面,本专利技术提供的多变量拍类体育运动数据的可视分析系统包括:数据库,从不同的拍类体育项目收集数据,并预处理为相同的数据格式,存储到所述数据库中;后端处理器,从所述数据库读取数据,并处理前端界面的请求;所述后端处理器还用于时间序列特征挖掘、投影和信息熵计算;前端界面,为领域专家提供交互式的数据可视化,从而进行数据分析。其中,前端界面包括:属性编辑模块,允许用户选择观测的属性、调整不同属性的权重、调整每个属性中不同值的相似度;图案编辑模块,使用一个组合式的图案对一个击球事件进行可视化;特征比较模块,用户按照特定的筛选条件,将数据集分为两个对照组,两个对照组分别计算特征子序列,进行对比;散点图总览模块:将挖掘出的特征投影到二维空间,构成散点图;序列实例模块:用户可以查看每个特征子序列对应的所有原序列。在图案编辑模块中,允许用户修改每个属性所使用的符号、调整每个属性对应的符号显示的区域、定义每个属性中每个值对应的可视化编码;不同的符号组合到一起,展示一次击球事件中不同的属性。与现有技术相比,本专利技术的有益之处在于:通过本专利技术的多变量拍类体育运动数据的可视化分析方法,能够有本文档来自技高网
...

【技术保护点】
1.一种多变量拍类体育运动数据的可视分析方法,其特征在于,包括以下步骤:/n1)收集不同拍类体育运动项目的数据,并预处理为相同的数据格式,将每次击球表达为一个多属性事件;/n2)将每个回合表述为由若干多属性事件组成的序列,同一种体育项目中若干回合的数据组成一个数据集;/n3)对于某个回合,计算其对应的序列中使用特征子序列重构原序列的校正成本;/n4)以校正成本最低时使用的特征子序列作为可视化分析对象。/n

【技术特征摘要】
1.一种多变量拍类体育运动数据的可视分析方法,其特征在于,包括以下步骤:
1)收集不同拍类体育运动项目的数据,并预处理为相同的数据格式,将每次击球表达为一个多属性事件;
2)将每个回合表述为由若干多属性事件组成的序列,同一种体育项目中若干回合的数据组成一个数据集;
3)对于某个回合,计算其对应的序列中使用特征子序列重构原序列的校正成本;
4)以校正成本最低时使用的特征子序列作为可视化分析对象。


2.根据权利要求1所述的多变量拍类体育运动数据的可视分析方法,其特征在于,所述的多属性事件表示为e={a1=v1,a2=v2,...,ai=vi,...},所述的序列表示为S=(e1,e2,e3,...,en),同时每个回合会记录发球方、胜出方以及局号信息。


3.根据权利要求1所述的多变量拍类体育运动数据的可视分析方法,其特征在于,步骤3)中,通过以下方法计算校正成本:
3-1)遍历该回合中每一个属性,并单独计算每个属性的校正成本;
3-2)对于每个属性ai,分别提取原序列和特征子序列中每个事件的第i个属性值,构成单变量的序列Si和单变量的特征子序列Pi;
3-3)计算Si和Pi的最长公共子序列lcs,其中,相似的属性值视为序列与特征子序列的公共部分;
3-4)计算lcs在Si和Pi中的占位长度,即从lcs开始到lcs结束,序列中经历的事件个数,分别记为spanS和spanP;
3-5)定义三个可调节的参数,分别是通过限制增加事件,从而控制特征序列长度的costins;通过限制删除事件,从而控制特征序列真实性的costdel;以及通过限制不连续事件,从而控制序列连续性的costcon;
3-6)计算从Si到lcs的校正成本ΔLi1=(len(Si)-len(lcs))×costins+(spanS-len(lcs))×costcon,其中len()函数用于计算序列长度;
3-7)计算从lcs到Pi的校正成本ΔLi2=(len(Pi)-len(lcs))×costdel+(spanP-l...

【专利技术属性】
技术研发人员:巫英才吴江
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1