【技术实现步骤摘要】
一种在线跨通道交互式并行蒸馏架构姿态预估方法及装置
[0001]本专利技术涉及人工智能计算机视觉
,具体提供一种在线跨通道交互式并行蒸馏架构姿态预估方法及装置。
技术介绍
[0002]人体姿态预估是人工智能计算机视觉中一个重要的
通过对场景中人的行为进行估计,可以更好的实现人机交互。目前人体姿态预估常用于工人违规操作检测、安防领域以及VR穿戴设备中。人体姿态预估算法中目标检测模型提取人体检测框的准确性对人体关键点定位的准确性和稳定性至关重要。
[0003]现有注意力模型没有考虑通道特征信息和空间特征信息的关联性,导致准确性不高。
技术实现思路
[0004]本专利技术是针对上述现有技术的不足,提供一种实用性强的在线跨通道交互式并行蒸馏架构姿态预估方法。
[0005]本专利技术进一步的技术任务是提供一种设计合理,安全适用的在线跨通道交互式并行蒸馏架构姿态预估装置。
[0006]本专利技术解决其技术问题所采用的技术方案是:
[0007]一种在线跨通道交互式并行蒸馏架构姿态预估方法,首先视频采集装置获取外界视频流,将视频流切分成帧输入到特征提取网络中进行特征提取;
[0008]将提取到的特征输送到YOLOV5目标检测模型中,检测每一帧图像中的目标人体所在位置并标记检测框,得到目标人体的特征数据;
[0009]将目标人体特征数据传递给姿态检测模型Faster
‑
Pose,得到人体关键点特征信息;将得到的人体关键点特征信息通过线性变换 ...
【技术保护点】
【技术特征摘要】
1.一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征在于,首先视频采集装置获取外界视频流,将视频流切分成帧输入到特征提取网络中进行特征提取;将提取到的特征输送到YOLOV5目标检测模型中,检测每一帧图像中的目标人体所在位置并标记检测框,得到目标人体的特征数据;将目标人体特征数据传递给姿态检测模型Faster
‑
Pose,得到人体关键点特征信息;将得到的人体关键点特征信息通过线性变换映射到特征图中,得到带有人体关键点标注的特征图。2.根据权利要求1所述的一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征在于,所述特征提取网络设计成CSP结构,并引入跨通道交互式注意力机制,跨通道交互式注意力机制联合通道注意力和空间注意力,使用协方差矩阵计算通道注意力模型中特征图每两个通道的相似性,相似度高的通道进行融合;空间注意力中使用二阶有限差分法计算特征图像素值差和像素梯度方向。3.根据权利要求2所述的一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征在于,两个所述通道的协方差计算值为负数则表示负相关,值为0则表示两个通道之间相互独立互不相关,值为正数则表示两个通道正相关进行特征融合;首先计算每个通道的均值如公式(1)所示:所有通道的均值特征记为计算每个通道的方差如公式(2)所示:所有通道的方差记为:计算通道C1,C2之间的协方差如公式(3)所示:以此类推得到的所有通道相似性协方差值记为Cov
i,k
,只在不同通道之间做协方差,根据协方差值将正相关性的通道进行逐像素融合。4.根据权利要求3所述的一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征在于,将提取到的特征输送到YOLOV5目标检测模型中,检测每一帧图像中的目标人体所在位置并标记检测框,得到目标人体的特征数据;所述YOLOV5目标检测模型使用公开数据集MSCOCO 2017进行训练。MSCOCO 2017数据集按照预先设定的比例随机抽取,对样本数据做数据增强预处理操作。5.根据权利要求4所述的一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征在于,所述数据增强的方式包括对图像进行多角度旋转,旋转角度划分间隔为30度,对图像按照概率P对图像随机掩膜处理,掩膜下的像素值置为0,对图像进行上、下、左、右翻转,对图像进行不同程度的扭曲变形处理以及对图像进行颜色扰动。6.根据权利要求5所述的一种在线跨通道交互式并行蒸馏架构姿态预估方法,其特征
在于,所述通道注意力模型使用SoftMax函数得到通道特征概率矩阵,空间注意力模型使用SoftMax函数得到空间...
【专利技术属性】
技术研发人员:郑群,杨义坤,孙桂刚,李超,朱宪,
申请(专利权)人:厦门信息技术应用创新研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。