基于多尺度级联HourGlass网络的人体关键点检测方法技术

技术编号：19178404 阅读：72 留言：0更新日期：2018-10-17 00:33

基于多尺度级联HourGlass网络的人体关键点检测方法：一：将输入图片生成128*128、64*64和32*32特征图；二：将128*128的特征图送入前2个Modified HourGlass模块中，此2个模块输入输出都为128*128特征图；三：将第2个Modified HourGlass模块输出的128*128特征图和128*128热点图进行下采样成64*64的特征图与步骤一生成的64*64特征图一并送入中间4个Modified HourGlass模块中，此4个模块的输入和输出均为64*64特征图；四：将第6个Modified HourGlass模块输出的64*64特征图和64*64热点图进行下采样成32*32特征图与步骤一生成的32*32特征图一并送入最后2个模块中；五：提取8个Modified HourGlass模块的损失函数，将损失函数相加；网络根据损失函数进行后向反馈，当损失函数达到预期值并稳定后停止训练。

Detection method of human key points based on multi-scale cascade HourGlass network

Human Key Points Detection Based on Multi-scale Cascaded HourGlass Networks: First, 128*128, 64*64 and 32*32 feature maps are generated from input images; Second, 128*128 feature maps are sent into the first two Modified HourGlass modules, and the input and output of these two modules are 128*128 feature maps; Third, the second Modified HourGlass module is input and output. The 128 * 128 feature map and 128 * 128 hot spot map are downsampled into 64 * 64 feature map and 64 * 64 feature map generated by step 1. The input and output of these four modules are 64 * 64 feature map. Fourthly, 64 * 64 feature map and 64 * 64 hot spot map of the sixth Modified Hour Glass module are output. Sampling down into 32 * 32 characteristic graph and 32 * 32 characteristic graph generated by step one and feeding into the last two modules together; Fifth: extracting the loss function of eight Modified HourGlass modules and adding the loss function; the network carries out backward feedback according to the loss function, and stops training when the loss function reaches the expected value and stabilizes.

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度级联HourGlass网络的人体关键点检测方法
本专利技术属于单人姿态估计
，具体涉及一种基于多尺度级联HourGlass网络的人体关键点检测方法。
技术介绍
经典的单人姿态估计方法是基于图形结构模型。在这种模型中，身体各部分的空间相关性被表示为树形结构的图模型。后来为增强树形结构捕获人体关键点间的对称性和长距离关系发展出通过引入循环机制的非树形模型。总体而言，基于图形结构模型的单人姿态估计存在关键点重复计数、建模复杂等缺点。随着深度学习的发展，出现了很多基于CNN的单人姿态估计方法。如DeepPose直接回归关节的坐标。该网络使用卷积神经网络和级联的思想，将以前用于分类的卷积神经网络，通过改变误差函数，将其转变为用于关节点坐标估计的卷积神经网络。同时，采用级联的方式，利用局部图片进行更高精度的坐标计算。但是，由于人体运动灵活，该模型可扩展性较差。FlowingConvNets将姿态估计看作是检测问题，输出是热点图。其创新点在于从卷积神经网络的3和7层提取出来，再经过卷积操作，称之为空间融合模型，用来提取关节点之间的内在联系；同时使用光流信息，用来...

【技术保护点】
1.一种基于多尺度级联HourGlass网络的人体关键点检测方法，其特征是按如下步骤：步骤一：将输入的图片生成3种不同尺度的特征图，特征图的尺寸分别为128*128、64*64和32*32；步骤二：将尺寸为128*128的特征图送入前2个Modified HourGlass模块中，此2个Modified HourGlass模块输入和输出都为128*128的特征图；步骤三：将第2个Modified HourGlass模块输出的尺寸为128*128的特征图和尺寸为128*128的热点图都进行下采样成64*64的特征图与步骤一中由原始图片生成的64*64的特征图一并送入中间4个Modified Ho...

【技术特征摘要】
1.一种基于多尺度级联HourGlass网络的人体关键点检测方法，其特征是按如下步骤：步骤一：将输入的图片生成3种不同尺度的特征图，特征图的尺寸分别为128*128、64*64和32*32；步骤二：将尺寸为128*128的特征图送入前2个ModifiedHourGlass模块中，此2个ModifiedHourGlass模块输入和输出都为128*128的特征图；步骤三：将第2个ModifiedHourGlass模块输出的尺寸为128*128的特征图和尺寸为128*128的热点图都进行下采样成64*64的特征图与步骤一中由原始图片生成的64*64的特征图一并送入中间4个ModifiedHourGlass模块中，此4个ModifiedHou...

【专利技术属性】
技术研发人员：郭春生，都文龙，夏尚琴，应娜，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人