【技术实现步骤摘要】
一种基于时空异构双流卷积网络的舞蹈评分方法
[0001]本申请涉及数据不平衡
、
卡尔曼滤波
、
舞蹈评分领域,具体涉及一种基于时空异构双流卷积网络的舞蹈评分方法
。
技术介绍
[0002]当前的动作识别是计算机视觉的一个研究热点内容,舞蹈评分方法基于动作识别为基础,融合声音数据
、
服饰
、
表演风格等特征数据,构成一种基于深度学习的
AI
自主评分标准
。
舞蹈动作的识别目标是从一个未知的视频序列中自动分析其中正在进行的行为,动作识别在视频监控
、
行为分析
、
智能家居
、
视频检索和人机智能交互等领域发挥着重要的作用,但由于视点变化
、
背景杂乱和光照条件等限制,动作识别仍然面临着重大挑战
。
近年来,深度卷积网络在图像和语音识别方面取得了巨大的突破
。
此后,计算机视觉的研究人员一直试图将卷积网络转移到动作识别上来应用
。
与图像领域的成功相比,深度学习在基于视频的动作识别领域发展相对缓慢
。
主要是因为与图像数据相比,视频数据的规模和多样性是不可比拟的,因此需要建立一个用于深度网络训练的大规模标记视频数据库;与二维图像相比,视频包含更多的时序信息,引入了比图像更复杂的分析工作
。
[0003]舞蹈评分方法除了依靠动作识别,还需要考虑舞蹈配乐
、
...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于时空异构双流卷积网络的舞蹈评分方法,其特征在于,包括如下步骤:通过传感器获取专业舞蹈者的舞蹈音视频数据,作为音视频数据集,对专业舞蹈者的舞蹈视频数据处理成特征参数形式,作为特征参数数据集;采用卡尔曼滤波方法对特征参数进行处理,对来自不同传感器的音频或视频数据进行数据融合;构建时空异构双流卷积网络,将融合后的数据输入到时空异构双流卷积网络,用于对时空异构双流卷积网络进行训练
,
所述时空异构双流卷积网络的输出是舞蹈评分
;
利用训练好的时空异构双流卷积网络对待评分的舞蹈音视频数据进行评分
。2.
根据权利要求1所述一种基于时空异构双流卷积网络的舞蹈评分方法,其特征在于,将音视频数据集中的每段舞蹈视频映射为特征参数的形式:,每个样本特征参数对应一个特征标签,其中表示特征参数的总数;其中,特征参数是通过
Slow
‑
Fast
方法对视频进行分解动作得到;特征参数是舞蹈者音乐卡点节拍表现;特征参数,属于主观印象特征,由评分者提供
。3.
根据权利要求2所述一种基于时空异构双流卷积网络的舞蹈评分方法,其特征在于,所述特征参数包括少数类特征参数和多数类特征参数;少数类特征参数的采集量小于多数类特征的采集量;其中主观印象特征为少数类特征,其它特征参数为多数类特征;新样本是类别平衡的特征参数;按照式(1)合成新样本,表示如下: (1)
其中代表第个原始样本数据特征参数,的取值范围为,表示选择的最近邻特征参数,为0到1之间的随机数
。4.
根据权利要求3所述一种基于时空异构双流卷积网络的舞蹈评分方法,其特征在于,将专业舞蹈者的音视频数据集分为训练集
、
测试集和验证集;训练集中多数类样本特征参数和少数类样本特征参数的数据数量分别表示为
M
和
N
,基于特征参数的数据分布的重采样方法生成的平衡子集的样本总数表示为
S
;经过聚类后的多数类训练集被分为
k
个聚类,
k
个聚类中的多数类样本数量分别表示为,各个聚类的数量之和满足公式(3);
(3)
对于每个平衡子集,从多数类中重采样的样本总数如公式(4)所示; (4)
从少数类样本集中随机采样一半数量的样本得到少数类样本子集,并将少数类样本子集和多数类样本子集进行合并,得到平衡训练子集
。5. 根据权利要求1所述一种基于时空异构双流卷积网络的舞蹈评分方法,其特征在于,采用所述采用卡尔曼滤波方法对特征参数进行处理,舞蹈动作特征的状态方程为:
ꢀꢀ
(5)
式中表示舞蹈动作在时刻的特征状态值;表示舞蹈动作在时刻的特征状态值;表示舞蹈动作特征状态变换矩阵;表示传感器采集数据过程噪声;舞蹈动作的特征观测方程为 (6)
式中表示时刻测量舞蹈动作特征值;测量矩阵;表示传感器采集数据观测噪声;和是相互独立的高斯白噪声;根据式(5)对舞蹈动作特征状态进行一步预测,利用时刻舞蹈动作状态的特征最优估计值预测 时刻的舞蹈动作特征一步预测值:
技术研发人员:沈玉龙,陈森霖,袁博,胡凯,
申请(专利权)人:南京栢拓视觉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。