【技术实现步骤摘要】
编码器训练方法、行为识别方法、电子设备和存储介质
[0001]本申请涉及计算机视觉
,特别是涉及一种编码器训练方法、行为识别方法、电子设备和存储介质。
技术介绍
[0002]行为识别作为计算机视觉领域的一个重要分支,行为识别模型的应用场景变得更加广泛,相较于RGB图像组成的视频流,骨架序列具有不易受背景、光照和视角等因素的干扰而且计算代价小的优势,因此,基于骨架序列的行为识别方法越来越受到人们的重视。现有的行为识别模型通常使用门控循环单元(Gate Recurrent Unit,GRU)或长短时记忆网络(LongShort Term Memory,LSTM)作为编码器,由于GRU和LSTM缺少对空间的建模能力,导致行为识别模型中的编码器对骨架序列进行编码时的空间建模能力不足,对骨架序列进行编码的准确性较低。
技术实现思路
[0003]本申请主要解决的技术问题是提供一种编码器训练方法、行为识别方法、电子设备和存储介质,能够增强编码器对骨架序列进行编码时的空间建模能力,提高编码器对骨架序列进行编码的准确性。
[0004]为解决上述技术问题,本申请第一方面提供一种编码器训练方法,包括:获取训练目标对应的骨架视频帧序列;其中,所述骨架视频帧序列中每个骨架视频帧包括基于所述训练目标的第一数量的关节点确定的骨架信息;所述第一数量为大于1的整数;对所述骨架视频帧序列中第二数量的第一视频帧进行随机遮挡生成时间遮挡骨架序列,对所述骨架视频帧序列中第二视频帧包含的第三数量的关节点进行随机遮挡生成空间遮挡骨架 ...
【技术保护点】
【技术特征摘要】
1.一种编码器训练方法,其特征在于,所述编码器应用于行为识别,所述方法包括:获取训练目标对应的骨架视频帧序列;其中,所述骨架视频帧序列中每个骨架视频帧包括基于所述训练目标的第一数量的关节点确定的骨架信息;所述第一数量为大于1的整数;对所述骨架视频帧序列中第二数量的第一视频帧进行随机遮挡生成时间遮挡骨架序列,对所述骨架视频帧序列中第二视频帧包含的第三数量的关节点进行随机遮挡生成空间遮挡骨架序列;所述第三数量为小于所述第一数量的整数;利用所述时间遮挡骨架序列、所述空间遮挡骨架序列和所述骨架视频帧序列,调整所述编码器的参数;响应于满足第一收敛条件,输出训练后的所述编码器。2.根据权利要求1所述的编码器训练方法,其特征在于,所述对所述骨架视频帧序列中第二数量的第一视频帧进行随机遮挡生成时间遮挡骨架序列的步骤,包括:从所述骨架视频帧序列随机选取所述第二数量的骨架视频帧为所述第一视频帧;基于所述骨架视频帧序列中除所述第一视频帧外的其它骨架视频帧,获得所述时间遮挡骨架序列。3.根据权利要求1所述的编码器训练方法,其特征在于,所述对所述骨架视频帧序列中第二视频帧包含的第三数量的关节点进行随机遮挡生成空间遮挡骨架序列的步骤,包括:从所述第一数量的关节点中确定出第三数量的关节点;以及从所述骨架视频帧序列随机选取第四数量的骨架视频帧作为所述第二视频帧;在所述第二视频帧中对所述第二数量的关节点进行遮挡处理;基于第三视频帧和进行遮挡处理后的第二视频帧,获得所述空间遮挡骨架序列,所述第三视频帧为所述骨架视频帧序列中除所述第二视频帧之外的骨架视频帧。4.根据权利要求1
‑
3任一项所述的编码器训练方法,其特征在于,所述编码器包括至少一个图卷积层和至少一个时间卷积层,且所述编码器中的所述图卷积层和所述时间卷积层交替连接。5.根据权利要求1
‑
3任一项所述的编码器训练方法,其特征在于,所述利用所述时间遮挡骨架序列、所述空间遮挡骨架序列和所述骨架视频帧序列,调整所述编码器的参数的步骤,包括:将所述时间遮挡骨架序列输入所述编码器,获得第一编码骨架序列,将所述第一编码骨架序列输入第一解码器,获得第一骨架序列;以及,将所述空间遮挡骨架序列输入所述编码器,获得第二编码骨架序列,将所述第二编码骨架序列输入第二解码器,获得第二骨架序列;基于所述第一骨架序列、所述第二骨架序列和所述骨架视频帧序列,确定综合损失值;基于所述综合损失值调整所述编码器、所述第一解码器和所述第二解码器中的参数。6.根据权利要求5所述的编码器训练方法,其特征在于,所述基于所述第一骨架序列、所述第二骨架序列和所述骨架视频帧序列,确定综合损失值的步骤,包括:基于所述第一骨架序列和所述骨架视频帧序列的偏差信息,确定第一损失值;以及基于所述第二骨架序列和所述骨架视频帧序列的偏差信息,确定第二损失值;对所述第一损失值和所述第二损失值进行加权求和,确定所述综合损失值。
7.根据权利要求1所述的编码器训练方法,其特征在于,所述利用所述时间遮挡骨架...
【专利技术属性】
技术研发人员:李兴明,敦婧瑜,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。