一种基于极坐标表示的数字冰壶策略价值提取方法技术

技术编号：34033438 阅读：12 留言：0更新日期：2022-07-06 11:42

本发明专利技术公开了一种基于极坐标表示的数字冰壶策略价值提取方法，属于深度学习领域的人工智能和计算机视觉方向，建立了基于极坐标表示的冰壶位置特征提取模型，主要解决数字冰壶位置特征提取过程中造成的确定性离散化的问题，从而优化策略价值网络提取。算法主要包括三部分，数据处理部分、特征提取部分和策略价值头部分：数据处理部分将传统的数字冰壶数据集转化为极坐标表示的冰壶数据集，特征提取部分针对极坐标特点，设置新的网络结构充分提取冰壶位置信息，策略价值头部分用于提取当前位置下，选取某一动作的概率和可能得到的价值，以便后续正确进行数字冰壶比赛决策的强化学习。这种基于极坐标表示的数字冰壶策略价值提取方法，在数字冰壶比赛数据的监督特征提取时误差小，效率高，具有较强的可扩展性，能够有效地提高数字冰壶决策的速度和精度。地提高数字冰壶决策的速度和精度。

A value extraction method of digital curling strategy based on polar coordinate representation

全部详细技术资料下载

【技术实现步骤摘要】
一种基于极坐标表示的数字冰壶策略价值提取方法

[0001]本专利技术属于深度学习领域，是图像处理领域中的一项重要应用，尤其是涉及一种基于极坐标表示的数字冰壶策略价值提取方法。
技术背景
[0002]随着冰雪运动的发展，冰壶运动越来越受到重视。作为一项技巧和谋略相结合的比赛项目，借助计算机的力量来规划冰壶比赛策略显得尤为重要。
[0003]目前主流的冰壶辅助决策方法在精度和速度方面已经有了不错的效果，由于冰壶的动作和状态空间是连续的，而深度神经网络对于大的、非凸的连续动作空间是不直接适用的。为了进行辅助决策通常需要把连续型的空间进行离散化后再提取相应特征，以降低决策树的宽度和深度，然而空间确定性离散化会对政策评价和改进产生较大的偏差，这与实际比赛智能化策略推荐的需求之间有巨大的矛盾。因此，亟需一种能够有效无误地进行冰壶位置表示和特征提取的方法，以优化数字冰壶策略价值提取。
[0004]数字冰壶策略价值提取的目的是，通过冰壶位置表示和特征提取，将数字冰壶数据进行有效分析，从而得到不同比赛状态下，选取某个动作的概率和价值，通常用于强化学习的监督学习部分，提高提取精度和效率。通过坐标映射将冰壶数据集进行修改，并根据特征提取的特点，有效地将其转化至可微连续的特征函数空间内，将其转化为适用于深度学习的形式，借助神经网络，求出基于当前数据集，动作策略建议的概率和价值。
[0005]我们提出的基于极坐标表示的数字冰壶策略价值提取方法在数字冰壶决策过程中，可以在更短的时间内训练完强化学习监督网络，有效地提高了数...

【技术保护点】

【技术特征摘要】
1.一种基于极坐标表示的数字冰壶策略价值提取方法，所述方法包括：步骤1)，将原始的数字冰壶比赛数据，进行坐标变换，变换到以冰壶大本营中心点为原点来进行表示；步骤2)，将变换到以冰壶大本营中心点为原点的直角坐标系表示的冰壶数据，转化为以冰壶大本营中心点为原点的极坐标系下进行表示；步骤3)，将极坐标下的数据进行极坐标空间变换，将其转化为适用于神经网络的结构；步骤4)，设计极坐标特征提取网络模型，分别设计特征提取部分和策略价值头部分的网络结构；步骤5)，在新的网络模型...

【专利技术属性】
技术研发人员：李宗民，肖倩，孙浩淼，孙文洁，李亚传，王向东，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人