一种艺术体操动作生成方法技术

技术编号：39038182 阅读：8 留言：0更新日期：2023-10-10 11:51

本发明专利技术公开了一种艺术体操动作生成方法，包括：对专业的艺术体操运动员进行动作捕捉；先进行音频特征提取，将音频特征分为音频片段；艺术体操动作捕捉视频分为视频片段；将音频片段和体视频片段进行数据归一化，再输入至生成扩散模型中，进行模型训练；对每个艺术体操片段生成的体操动作和音频的适配性进行打分，得分最高的艺术体操片段作为生成片段保留；使用损失函数结合动量梯度下降法算法对数据集的视频进行训练，得到艺术体操动作生成模型，输入音频通过模型得到艺术体操动作视频。本发明专利技术使用了生成扩散模型用于艺术体操的，相比于GAN等神经网络模型具有长期建模能力，能够生成长期稳定的动作序列。够生成长期稳定的动作序列。够生成长期稳定的动作序列。

全部详细技术资料下载

【技术实现步骤摘要】
一种艺术体操动作生成方法

[0001]本专利技术涉及体育动作智能生成领域，具体涉及一种艺术体操动作生成方法。

技术介绍

[0002]艺术体操作为一项新兴的运动项目，其运动规范、技术难度和美学标准等方面也在不断演进和发展，需要不断创新和提高。艺术体操运动员需要进行不断的训练和练习，以提高自己的技术水平和竞技成绩。在训练过程中，艺术体操教练需要不断设计和改进训练方案和动作，以满足运动员的需求，本专利技术旨在使用人工智能的模型结合相应的音乐进行新的艺术体操动作生成。
[0003]现有的基于深度学习生成视频的方法主流模型为GAN(generative adversarial network)网络及其改进版本。然而，受限于这些网络的长期建模能力，很难生成长期稳定的动作序列。对于超过10s的音乐，生成序列在音乐结束时趋于冻结或漂移。

技术实现思路

[0004]本专利技术提供了一种艺术体操动作生成方法。
[0005]本专利技术利用一种改进的生成扩散模型(Generative Diffusion Model，GDM)进行高精度的体育教学视频生成，GDM是一种通过根据噪声扩散的逆过程用于生成视频的深度学习模型，现有的扩散模型往往较难捕捉长期依赖关系，可能导致在生成的较长时间的体操动作时出现不连贯性。因此本专利技术通过设计一种两阶段的生成模型，第一阶段通过GDM模型生成不同风格的艺术体操动作，第二阶段通过设计一个，通过对体操动作的连贯性检索以及与关注不同音乐间的适配性。从而得到一个完整的新型艺术体操动作。...

【技术保护点】

【技术特征摘要】
1.一种艺术体操动作生成方法，其特征在于，包括以下步骤：1)对专业的艺术体操运动员进行动作捕捉，获得艺术体操动作捕捉视频；2)对艺术体操动作捕捉视频中音乐进行音频特征提取，将音频特征分为音频片段艺术体操动作捕捉视频分为视频片段，记将音频片段和体视频片段进行数据归一化，再输入至生成扩散模型中，进行模型训练；3)通过训练后的生成扩散模型生成多个艺术体操片段，对每个艺术体操片段生成的体操动作和音频的适配性进行打分，得分最高的艺术体操片段作为生成片段保留；4)在生成扩散模型中加入时间关系约束，将步骤3)获得的生成片段输入到加入时间关系约束的生成扩散模型进行训练，在训练过程中，引入同步性损失来优化同步性，得到新的损失函数L_total，使用损失函数L_total结合动量梯度下降法算法对数据集的视频进行训练，得到艺术体操动作生成模型；5)将待生成艺术体操动作的音频输入到艺术体操动作生成模型中，输出的结果经过插值，得到艺术体操动作视频。2.根据权利要求1所述的艺术体操动作生成方法，其特征在于，步骤1)中，所述的捕捉视频包括专业艺术体操动作以及相对应的音乐。3.根据权利要求2所述的艺术体操动作生成方法，其特征在于，所述的专业艺术体操动作包括绳操、球操、圈操、带操和棒操项目类型。4.根据权利要求1所述的艺术体操动作生成方法，其特征在于，步骤2)中，所述的音频片段为中，t为时间段,N为训练阶段的音乐片段数量，对每个音频片段的使用Librosa库进行特征提取得到时序特征和梅尔语谱图T和C
m
分别为音频的时长和通道数，W,H为梅尔语谱图的长和宽，3代表图谱是3通道的。5.根据权利要求1所述的艺术体操动作生成方法，其特征在于，步骤2)中，所述的数据归一化具体包括：将音频特征和体操动作数据归一化至相同的数值范围内。6.根据权利要求1所述的艺术体操动作生成方法，其特征在于，步骤3)中，对每个艺术体操片段生成的体操动作和音频的适配性进行打分，得分最高的艺术体操片段作为生成片段保留，...

【专利技术属性】
技术研发人员：刘文明，吴吉义，应晶，杨建波，张有健，
申请(专利权)人：杭州亚体智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人