一种基于深度学习网络的运动项目计数方法技术

技术编号：39741343 阅读：9 留言：0更新日期：2023-12-17 23:42

本发明专利技术公开了基于一种基于深度学习网络的运动项目计数方法，包括如下步骤：步骤一

全部详细技术资料下载

【技术实现步骤摘要】
帧的
Y1
都为0，而
tn
帧的输出为
Y1
等于1，
Y2
‑
Y10
等于0；
[0015](4)
损失计算：取
t1
至
tn
‑1的输出
Y1
，与
tn
的输出
Y1
至
Y10
，根据他们与真值的差异计算损失；
[0016](5)
模型迭代：将
t1
到
tn
帧依次输入模型视为一次迭代，记录中间过程中所有参数，根据模型损失反向传播，计算
t1
至
tn
时刻各模型参数的修正值，并对所有相同位置的修正值取平均用来更新模型；
[0017]步骤六
、
模型推理：训练好模型后，使用与训练时相同的数据预处理方式，将每帧结果拼接上上一帧的输出
Y2
‑
Y10
，组成
1X60
的数据，输入模型，并获得模型的输出
Y1
‑
Y10
，其中
Y1
表示计数结果：若为1表示计数加一，
Y2
‑
Y10
将作为下一帧输入中的
X52
‑
X60。
[0018]进一步，标注工具对运动计数算法相关数据进行标注，其自动将视频拆分为时域连续的单帧图片
,
每帧的默认标注结果都为
0,
用户

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习网络的运动项目计数方法，其特征在于，包括如下步骤：步骤一
、
数据标注：用户将运动视频导入标注工具，逐帧查看运动状态，并在满足计数条件的帧上对数据标注；步骤二
、
训练数据准备：使用人体关键点检测算法，获得运动人员的各个身体关键点坐标；步骤三
、
训练数据预处理：针对运动项目和周围环境的关系，对数据处理；步骤四
、
模型建立：模型采用多层全联接层组成，其输入维度为
1X60
，记为
X1
‑
X60
，输出维度为
1X10
，记为
Y1
‑
Y10
；全部采用
relu
激活函数；步骤五
、
模型训练：
(1)
每次从标注数据中取
n
帧，其中
n
为每次标注到上一次标注之间的所有连续帧的个数；
(2)
模型输入：将每帧结果展平为
1X51
，放人
X1
‑
X51
，拼接上上一帧模型输出
Y2
‑
Y10
，组成组成
1X60
的输入，首帧输入时
X52
‑
X60
为0；
(3)
模型输出真值：依次将
t1
到
tn
帧输入上述结构，输出结果的真值为：
t1
至
tn
‑1帧的
Y1
都为0，而
tn
帧的输出为
Y1
等于1，
Y2
‑
Y10
等于0；
(4)
损失计算：取
t1
至
tn
‑1的输出
Y1
，与
tn
的输出
Y1
至
Y10
，根据他们与真值的差异计算损失；
(5)
模型迭代：将
t1
到
tn
帧依次输入模型视为一次迭代，记录中间过程中所有参数，根据模型损失反向传播，计算
t1

【专利技术属性】
技术研发人员：栾博恒，易金城，李雨雨，周河，
申请(专利权)人：戈迪斯杭州智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人