一种高效的人体姿态估计方法及其模型搭建方法技术

技术编号：40537675 阅读：28 留言：0更新日期：2024-03-01 14:00

本发明专利技术提出了一种高效的人体姿态估计方法及其模型搭建方法，属于计算机视觉技术领域，基于HRNet网络结构，搭建一种轻量化的人体姿态估计模型GSEHRNet网络模型；基于高分辨率的网络，通过并行连接的方式，不断融合不同分辨率分支的特征；在充分利用了HRNet的网络特征的同时，在提取模块中使用一种新的提取模块GSE‑Block和SE‑Neck，能够有效的降低模型的参数量，同时保持较高的识别准确率。本发明专利技术提出的GSEHRNet人体姿态估计模型，是一个模型轻量化的过程，充分发挥了Ghost Module的轻量型特征，相较于非轻量化模型，本发明专利技术在损失了少量精确度的同时，参数量大大降低。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉，尤其涉及一种高效的人体姿态估计方法及其模型搭建方法。

技术介绍

1、在深度学习出现之前，主要有两种人体姿态估计方法，图形结构模型和可变形零件模型。

2、图形结构模型是将身体进行树结构表示，以此来建模身体部位的空间关联性，进而预测人体关键点的位置，通过使用像素位置和方向参数对关键点进行建模，这种方法无法捕捉不可见或可变形身体部位之间的相关性，因此在模型被遮挡或者不在画面中时，模型出错概率较高。并且该模型对身体部位之间进行了简化处理，也会导致预测结果的不准确性。

3、可变形零件模型实质上时一个模型集合，由可变形配置组成，这种方法是通过多个非定向零件来创建人体的可变形配置，这种模型相对于图形结构模型来说会有所提升，但是这种复杂的零件模型也会导致高额的计算量。

4、近年来，随着科技的进步与不断发展，智能设备的不断出现与更新，各种智能的设备得到了大大的提高。计算机设备也随着科技的不断发展有了很大的提高，随之得到飞速发展的是依靠计算机的强大算力的深度学习(deep learning)。计...

【技术保护点】

1.一种高效的人体姿态估计模型的搭建方法，其特征在于，包括以下步骤：

2.如权利要求1中所述的一种高效的人体姿态估计模型的搭建方法，其特征在于，所述步骤2中原始数据进行预处理具体包括：数据增强，通过仿射变换对图片进行随机旋转-45°到45°之间、对图片进行随机缩放在0.65到1.35比例之间、随机水平翻转以及裁剪，对图片的比例调整是保持目标原比例缩放到对应尺度然后在进行相应的边距调整；同时，对未标注数据进行关键点标注。

3.如权利要求1中所述的一种高效的人体姿态估计模型的搭建方法，其特征在于，所述步骤3中搭建的一种轻量化的人体姿态估计模型GSEHRNet网络模型，...

【技术特征摘要】

1.一种高效的人体姿态估计模型的搭建方法，其特征在于，包括以下步骤：

3.如权利要求1中所述的一种高效的人体姿态估计模型的搭建方法，其特征在于，所述步骤3中搭建的一种轻量化的人体姿态估计模型gsehrnet网络模型，具体结构为：所述的gsehrnet网络模型采用重构后的网络模块重新组件网络，以重构后的se-neck模块为第一层layer1的提取网络，通过一次过渡层transition1之后将网络下采样增加一个分支变为两个分支的网络，之后再使用重构后的gse-block模块为第二层即网络的第二阶段stage2，对网络特征进行提取，同时融合两个分支的特征信息，然后再通过使用一次过渡层transition2通过下采样使网络再增加一个分支，变为三个分支，之后再使用重构后的gse-block模块为第三层，即网络的第三阶段stage3，对网络特征进行提取，同时融合三个分支的特征信息，然后再通过使用一次过渡层transition3通过下采样使网络再增加一个分支，变为四个分支，之后再使用重构后的gse-block模块为第四层，即网络的第四阶段stage4，对网络特征进行提取，同时融合四个分支的特征信息，然后以最高分辨率分支的结果为输出结果；同时对网络输出的结果使用cbam注意力机制以保留更多的细节特征。

4.如权利要求3所述的一种高效的人体姿态估计模型的搭建方法，其特征在于：所述第一层layer1就是重复堆叠的se-neck模块，所述se-neck模块是通过se注意力机制模块对bot...

【专利技术属性】
技术研发人员：付民，汤先瑞，孙梦楠，闵健，郑冰，
申请(专利权)人：中国海洋大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人