【技术实现步骤摘要】
一种基于特征选择和参数优化的冰球赛况预测方法
本专利技术属于大数据处理技术,尤其涉及一种冰球比赛结构预测技术,具体地说是一种基于特征选择和参数优化的冰球赛况预测方法。
技术介绍
随着信息技术的发展,竞技体育比赛数据的数据维度和数据量呈指数级增长。在冰球运动中,进攻位同时也为防守位,相较于其他运动,更强调人员配合和分工协作。进攻位置的战术布局、攻防转换都对比赛有着至关重要的影响,因而周边数据的有效性、对比标本的数据量都对赛事预测有直接性的影响;准确的赛况预测更能使得团队规避风险、取长补短,对实战具有极大的帮助。同时基于大数据分析的技术和战术安排、培训训练、可以为选手、教练员提供数据支持,使其训练更为高效。在进行冰球赛事统计时,不仅需要考虑球员的出场位置、防守成功率、进攻得分率;还需考虑周边数据的有效性和足够的对比标本(包括球员流动、联盟交换以及不同组合搭配的影响)。因此,数据量相当庞大且数据维度高。数据量级越大,预测结果越真实准确。但是,大量的数据也会导致比赛数据的样本呈现离散性、随机性和独立性,加深筛选有效特征的困难程度,增加处理时间。以经验预测法、指数平滑法、灰色预测法为代表的传统预测算法是根据数据的直接特性分析数据,算法思路简单,具有局限性,通常适合小样本数据的预测。针对冰球赛事预测这一问题,影响其预测结果的随机因素复杂,且呈现非线性关系,传统预测方法难以满足其需要。支持向量机(SVM)可以有效平衡学习结果的准确性,具有良好的泛化能力;为分类预测问题提供了很好的解决思路。同时由于支持向量机也基于统计学理论,可以解决线性可分问题和线性不可分问题;在处理非 ...
【技术保护点】
1.一种基于特征选择和参数优化的冰球赛况预测方法,其特征是它包括如下步骤:步骤1:对获取的待预测的冰球比赛数据进行数据标准化处理,得到冰球比赛数据集,即通过函数变换使数据映射到特定区间;步骤2:对已进行过数据标准化处理的冰球比赛数据集再一次使用基于稀疏表达思想和用L1范数最小化优化方法处理,获得冰球数据特征的稀疏表示重构系数,并将原始特征和重构特征的误差作为该特征的稀疏分数;步骤3:计算待处理的冰球比赛数据集中,拉普拉斯改进标准分类特征与每个特征变量的相关性;步骤4:根据步骤2和步骤3计算得到冰球比赛关键特征的稀疏分数以及分类类别与特征的相关关系,分析特征的稀疏分数与该特征和类别的相关性之间的相互关系提出冗余特征,实现特征选择;步骤5:通过混合GAPSO算法优化支持向量机的惩罚因子C以及核函数参数g,实现支持向量机的参数优化;步骤6:采用K折交叉验证,输出冰球比赛预测结果。
【技术特征摘要】
1.一种基于特征选择和参数优化的冰球赛况预测方法,其特征是它包括如下步骤:步骤1:对获取的待预测的冰球比赛数据进行数据标准化处理,得到冰球比赛数据集,即通过函数变换使数据映射到特定区间;步骤2:对已进行过数据标准化处理的冰球比赛数据集再一次使用基于稀疏表达思想和用L1范数最小化优化方法处理,获得冰球数据特征的稀疏表示重构系数,并将原始特征和重构特征的误差作为该特征的稀疏分数;步骤3:计算待处理的冰球比赛数据集中,拉普拉斯改进标准分类特征与每个特征变量的相关性;步骤4:根据步骤2和步骤3计算得到冰球比赛关键特征的稀疏分数以及分类类别与特征的相关关系,分析特征的稀疏分数与该特征和类别的相关性之间的相互关系提出冗余特征,实现特征选择;步骤5:通过混合GAPSO算法优化支持向量机的惩罚因子C以及核函数参数g,实现支持向量机的参数优化;步骤6:采用K折交叉验证,输出冰球比赛预测结果。2.根据权利要求1所述的预测方法,其特征是步骤2中计算冰球比赛数据集中各个特征的稀疏分数包括如下步骤:步骤2.1:对待处理的冰球比赛数据集,使用基于稀疏表达思想和用L1范数最小化优化方法以获得数据特征的稀疏表示重构系数;对于一个给定的冰球比赛数据集其中xi∈Rd,令数据矩阵X=[x1,x2,…,xn]∈Rd×n中的每列作为该数据集的特征向量;用公式对所有数据向量Xi计算基于稀疏表示的重构系数si;其中,X′是X不包含xi的数据矩阵;n维系数向量si=[si1,…,sii-1,0,sii+1,…,sin]T,因为在计算重构稀疏si时,没有将xi包含在X里面,因此sii=0;同时,sij,j≠i则表示数据向量xj对于重构xi所做的贡献;步骤2.2:用对每个特征在整个冰球比赛数据集样本上的重构误差求和,获得在整个冰球比赛数据集上的各个特征的稀疏表示保留能力即特征的稀疏分数;其中,用于表示第r维的原始特征xir与该特征基于重构系数矩阵得到重构特征之间的误差累加结果,用Var(X(r,:))表示第r维特征的方差;步骤2.3:将特征的稀疏分数S(r)按照升序排列。3.根据权利要求1所述的预测方法,其特征是所述步骤3的计算方法为:对待处理冰球赛事数据集,计算其分类类别与特征变量的相关性C(i):subject.to.k=1,2,…,dt=1,2,…,dNp≥1;式中,Np表示分类类别为p的样本个数;Nn表示分类类别不是p的样本个数;表示所有冰球比赛样本中的第i维特征变量的均值;表示冰球比赛数据样本集中的分类类别为p的第i维特征变量的均值;表示冰球比赛数据样本集中的非类别p的第i维特征变量的均值;xk,ip表示第i维特征变量中第k个类别p样本的值;xt,ip表示第i维特征变量中第t个非类别p样本的值;此时,冰球赛事中分类特征与特征变量相关性C(i)的计算结果是d维向量,当分类类别与特征之间相关关系越强时,计算得出的C(i)就越大...
【专利技术属性】
技术研发人员:薛善良,程思嘉,李梦颖,肖雪,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。