结合空洞卷积与级联金字塔网络的服饰关键点定位方法技术

技术编号：21185376 阅读：69 留言：0更新日期：2019-05-22 16:00

本发明专利技术涉及一种结合空洞卷积与级联金字塔网络的服饰关键点定位方法，包含三个部分：ResNet‑101、GlobalNet和RefineNet，通过ResNet‑101进行图像特征提取；GlobalNet进行简单的关键点定位；RefineNet整合来自GlobalNet的特征表征，识别余下的困难关键点。

Clothing Key Point Location Method Combining Void Convolution and Cascade Pyramid Network

The invention relates to a clothing key point location method combining hollow convolution and cascade pyramid network, which consists of three parts: ResNet 101, GlobalNet and RefineNet, which extracts image features through ResNet 101; GlobalNet carries out simple key point location; RefineNet integrates features from GlobalNet to identify remaining difficult key points.

全部详细技术资料下载

【技术实现步骤摘要】
结合空洞卷积与级联金字塔网络的服饰关键点定位方法
本专利技术涉及时尚领域、图像处理领域、关键点定位领域、深度学习领域，将级联金字塔网络(CascadePyramidNetwork，CPN)与空洞卷积相结合进行改进，实现服饰关键点定位任务。
技术介绍
近些年来，随着电商平台和时尚行业的快速发展，对于服饰分析的算法需求越来越迫切。服饰关键点定位能够有效提升服饰部位对齐，加速物体属性识别，使图像可自动分类归属，已引起社会广泛关注。目前应用于人体关键点检测算法已经取得长足发展，但在与时尚行业相互融合过程中，由于服饰在类别、比例和外观上的多变性，服饰关键点定位算法仍然面临重大挑战。对于人体关键点定位，大多数方法都是直接回归出人体关节点的坐标，但是由于人体运动的灵活性以及回归模型可扩展性较差，此类方法的效果都不太理想。随着深度学习技术的发展，其在图像分类、识别、以及关键点检测上已得到广泛应用，2016年Wei等提出的CPM(ConvolutionalPoseMachines，CPM)网络通过顺序化卷积方式进行空间信息以及纹理信息的表达，实现鲁棒性较强的关键点定位算法。同年Alejandro等提出Hourglass(StackHourglassNetworks)网络，通过引入多模块全卷积神经网络(ConvolutionalNeuralNetwork，CNN)来解决单人关键点定位，每个CNN模块捕捉不同尺度图片的特征，以此来发现人体空间关系，推断人体的关节点位置。随后，多人关键点检测算法逐渐出现，效果较好的为自顶向下的算法，即先检测出单人，再定位每个人的关键点。2017年...

【技术保护点】
1.一种结合空洞卷积与级联金字塔网络的服饰关键点定位方法，包含三个部分：ResNet‑101、GlobalNet和RefineNet，通过ResNet‑101进行图像特征提取；GlobalNet进行简单的关键点定位；RefineNet整合来自GlobalNet的特征表征，识别余下的困难关键点。包括：1)ResNet‑101特征提取网络：对于一张大小为N×N的输入图像，引入捷径跳过某些层的连接，再与主径汇合；2)基于GlobalNet的提取不同尺度特征的级联金字塔结构模块：在Conv4‑Conv5以空洞卷积代替原本的卷积操作，在增加感受野的同时不降低空间分辨率，分别产生空间尺度为256×N/4×N/4,512×N/8×N/8,512×N/8×N/8,512×N/8×N/8的特征图，后三组特征图尺度一样，底层的特征图Conv2和Conv3有比较高的空间分辨率，但是语义信息比较低；而高层的特征图Conv4和Conv5包含有更多的语义信息且空间分辨率未降低；3)基于GlobalNet的融合不同尺度特征级联模块：引入空洞卷积使得后三组特征图已经具有相同的尺寸可直接相加，仅在最后一层需要进行上采样...

【技术特征摘要】
1.一种结合空洞卷积与级联金字塔网络的服饰关键点定位方法，包含三个部分：ResNet-101、GlobalNet和RefineNet，通过ResNet-101进行图像特征提取；GlobalNet进行简单的关键点定位；RefineNet整合来自GlobalNet的特征表征，识别余下的困难关键点。包括：1)ResNet-101特征提取网络：对于一张大小为N×N的输入图像，引入捷径跳过某些层的连接，再与主径汇合；2)基于GlobalNet的提取不同尺度特征的级联金字塔结构模块：在Conv4-Conv5以空洞卷积代替原本的卷积操作，在增加感受野的同时不降低空间分辨率，分别产生空间尺度为256×N/4×N/4,512×N/8×N/8,512×N/8×N/8,512×N/8×N/8的特征图...

【专利技术属性】
技术研发人员：姚麟倩，李锵，关欣，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人