【技术实现步骤摘要】
帧的
Y1
都为0,而
tn
帧的输出为
Y1
等于1,
Y2
‑
Y10
等于0;
[0015](4)
损失计算:取
t1
至
tn
‑1的输出
Y1
,与
tn
的输出
Y1
至
Y10
,根据他们与真值的差异计算损失;
[0016](5)
模型迭代:将
t1
到
tn
帧依次输入模型视为一次迭代,记录中间过程中所有参数,根据模型损失反向传播,计算
t1
至
tn
时刻各模型参数的修正值,并对所有相同位置的修正值取平均用来更新模型;
[0017]步骤六
、
模型推理:训练好模型后,使用与训练时相同的数据预处理方式,将每帧结果拼接上上一帧的输出
Y2
‑
Y10
,组成
1X60
的数据,输入模型,并获得模型的输出
Y1
‑
Y10
,其中
Y1
表示计数结果:若为1表示计数加一,
Y2
‑
Y10
将作为下一帧输入中的
X52
‑
X60。
[0018]进一步,标注工具对运动计数算法相关数据进行标注,其自动将视频拆分为时域连续的单帧图片
,
每帧的默认标注结果都为
0,
用户
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于深度学习网络的运动项目计数方法,其特征在于,包括如下步骤:步骤一
、
数据标注:用户将运动视频导入标注工具,逐帧查看运动状态,并在满足计数条件的帧上对数据标注;步骤二
、
训练数据准备:使用人体关键点检测算法,获得运动人员的各个身体关键点坐标;步骤三
、
训练数据预处理:针对运动项目和周围环境的关系,对数据处理;步骤四
、
模型建立:模型采用多层全联接层组成,其输入维度为
1X60
,记为
X1
‑
X60
,输出维度为
1X10
,记为
Y1
‑
Y10
;全部采用
relu
激活函数;步骤五
、
模型训练:
(1)
每次从标注数据中取
n
帧,其中
n
为每次标注到上一次标注之间的所有连续帧的个数;
(2)
模型输入:将每帧结果展平为
1X51
,放人
X1
‑
X51
,拼接上上一帧模型输出
Y2
‑
Y10
,组成组成
1X60
的输入,首帧输入时
X52
‑
X60
为0;
(3)
模型输出真值:依次将
t1
到
tn
帧输入上述结构,输出结果的真值为:
t1
至
tn
‑1帧的
Y1
都为0,而
tn
帧的输出为
Y1
等于1,
Y2
‑
Y10
等于0;
(4)
损失计算:取
t1
至
tn
‑1的输出
Y1
,与
tn
的输出
Y1
至
Y10
,根据他们与真值的差异计算损失;
(5)
模型迭代:将
t1
到
tn
帧依次输入模型视为一次迭代,记录中间过程中所有参数,根据模型损失反向传播,计算
t1
技术研发人员:栾博恒,易金城,李雨雨,周河,
申请(专利权)人:戈迪斯杭州智能技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。