图像处理方法、系统、装置及存储介质制造方法及图纸

技术编号:32210299 阅读:8 留言:0更新日期:2022-02-09 17:16
本发明专利技术公开了一种图像处理方法、系统、装置及存储介质,包括:获取图像,并根据所述图像确定对应的语义标签及人像抠图结果;所述图像包括人像和物像;对所述图像中的物像进行检测,并计算所述物像与所述语义标签的相关度;将达到预设相关度的物像进行边缘检测,并根据边缘检测的结果对所述达到预设相关度的物像进行分割;将分割后的所述达到预设相关度的物像加入到人像抠图结果中得到目标图像。本发明专利技术实施例能够在人像抠图过程中将与人体行为强相关的物像进行保留,使基于人像抠图的语义更完整,可广泛应用于图像处理技术领域。可广泛应用于图像处理技术领域。可广泛应用于图像处理技术领域。

【技术实现步骤摘要】
图像处理方法、系统、装置及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像处理方法、系统、装置及存储介质。

技术介绍

[0002]人像抠图技术的核心是识别图像中的人体轮廓,并将人体轮廓与背景进行分离,广泛应用于人像抠图美化、照片或视频背景替换、证件照制作或隐私保护等场景。目前的人像抠图功能,主要是将图像或视频中的人体进行单独抠图,进而与其他的背景图像或视频进行叠加,生成新的图像或视频。但是上述抠图功能的应用中,有一类需求无法得到满足,即在原始图像或视频中存在于抠图的目标人体的行为动作具备强相关性的物体,如运动员手中的球拍、厨师手中的炒锅等,这些物体在抠图后的结果图像中无法得到保留,当抠图结果图像叠加到新的背景图像或视频中时,原图像或视频中人体行为由于缺乏相应的相关性物体的配合,使得整个人体行为的语义完整性被破坏,叠加后的图像或视频也无法完整呈现人体行为所携带的语义信息,造成了信息缺失,影响了人像抠图功能在这一类需求场景中的应用。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的是提供一种图像处理方法、系统、装置及存储介质,能够在人像抠图过程中将与人体行为强相关的物像进行保留,使基于人像抠图的语义更完整。
[0004]第一方面,本专利技术实施例提供了一种图像处理方法,包括以下步骤:
[0005]获取图像,并根据所述图像确定对应的语义标签及人像抠图结果;所述图像包括人像和物像;
[0006]对所述图像中的物像进行检测,并计算所述物像与所述语义标签的相关度;
[0007]将达到预设相关度的物像进行边缘检测,并根据边缘检测的结果对所述达到预设相关度的物像进行分割;
[0008]将分割后的所述达到预设相关度的物像加入到人像抠图结果中得到目标图像。
[0009]可选地,所述根据所述图像确定对应的语义标签,具体包括:
[0010]将所述图像输入到图像生成编码器获得所述图像的特征向量;
[0011]将所述图像的特征向量输入到语义分离器获得所述图像的语义标签。
[0012]可选地,所述对所述图像中的物像进行检测,具体包括:
[0013]对所述图像中的物像进行检测,获取所述物像的名称及物象框位置。
[0014]可选地,所述物象框位置通过将所述图像输入到目标检测网络获得,所述目标检测网络包括骨架网络、颈部网络和头部网络,具体包括:
[0015]将所述图像输入到所述骨架网络提取特征;
[0016]将所述特征输入到所述颈部网络得到不同尺度的特征图集合;
[0017]将所述不同尺度的特征图集合输入到所述头部网络生成预测框,并根据所述预测框的置信度确定所述物象框位置。
[0018]可选地,所述计算所述物像与所述语义标签的相关度,具体包括:
[0019]将所述物像的名称输入到词向量网络获得第一词向量;
[0020]将所述语义标签输入到词向量网络获得第二词向量;
[0021]将所述第一词向量及所述第二词向量输入到相关度分类器获得所述物像与所述语义标签的相关度。
[0022]可选地,所述将达到预设相关度的物像进行边缘检测,具体包括:
[0023]根据达到预设相关度的物像的物象框位置获取局部图像;
[0024]将所述局部图像输入到图像生成编码器获得局部图像的特征向量;
[0025]将所述局部图像的特征向量输入到边缘检测分类器获得所述局部图像的每个像素点属于达到预设相关度的物象的概率。
[0026]可选地,所述根据边缘检测的结果对所述达到预设相关度的物像进行分割,具体包括:
[0027]将所述局部图像的每个像素点属于达到预设相关度的物象的概率转换成对应的像素点透明度值;其中,每个像素点属于达到预设相关度的物象的概率越高,对应的像素点透明度值越低。
[0028]根据所述像素点透明度值分割得到达到预设相关度的物像。
[0029]第二方面,本专利技术实施例提供了一种图像处理系统,包括:
[0030]第一模块,用于获取图像,并根据所述图像确定对应的语义标签及人像抠图结果;所述图像包括人像和物像;
[0031]第二模块,用于对所述图像中的物像进行检测,并计算所述物像与所述语义标签的相关度;
[0032]第三模块,用于将达到预设相关度的物像进行边缘检测,并根据边缘检测的结果对所述达到预设相关度的物像进行分割;
[0033]第四模块,用于将分割后的所述达到预设相关度的物像加入到人像抠图结果中得到目标图像。
[0034]第三方面,本专利技术实施例提供了一种图像处理装置,包括:
[0035]至少一个处理器;
[0036]至少一个存储器,用于存储至少一个程序;
[0037]当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上述的图像处理方法。
[0038]第四方面,本专利技术实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述的图像处理方法。
[0039]实施本专利技术实施例包括以下有益效果:本专利技术实施例首先通过图像确定对应的语义标签,然后对图像中的物象进行检测并计算物象与语义标签的相关度;然后对达到预设相关度的物象进行分割,并将分割后的物像加入到人像抠图结果中得到目标图像;即通过计算物像与语义标签的相关度确定是否对物像进行分割并加入到人像抠图结果中,从而实现在人像抠图过程中将与人体行为强相关的物像进行保留,使基于人像抠图的语义更完
整。
附图说明
[0040]图1是本专利技术实施例提供的一种图像处理方法的步骤流程示意图;
[0041]图2是本专利技术实施例提供的一种根据图像确定对应的语义标签的步骤流程示意图;
[0042]图3是本专利技术实施例提供的一种根据图像的特征向量得到语义标签的步骤流程示意图;
[0043]图4是本专利技术实施例提供的一种根据图像获取物像框位置的步骤流程示意图;
[0044]图5是本专利技术实施例提供的一种计算物像与语义标签的相关度的步骤流程示意图;
[0045]图6是本专利技术实施例提供的一种对达到预设相关度的物像进行边缘检测的步骤流程示意图;
[0046]图7是本专利技术实施例提供的一种根据边缘检测的结果对达到预设相关度的物像进行分割的步骤流程示意图;
[0047]图8是本专利技术实施例提供的一种图像处理系统的结构框图;
[0048]图9是本专利技术实施例提供的一种图像处理装置的结构框图。
具体实施方式
[0049]下面结合附图和具体实施例对本专利技术做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0050]如图1所示,本专利技术实施例提供了一种图像处理方法,其包括的步骤如下所示,具体包括步骤S10本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取图像,并根据所述图像确定对应的语义标签及人像抠图结果;所述图像包括人像和物像;对所述图像中的所述物像进行检测,并计算所述物像与所述语义标签的相关度;将达到预设相关度的物像进行边缘检测,并根据边缘检测的结果对所述达到预设相关度的物像进行分割;将分割后的所述达到预设相关度的物像加入到人像抠图结果中得到目标图像。2.根据权利要求1所述的图像处理方法,其特征在于,所述根据所述图像确定对应的语义标签,具体包括:将所述图像输入到图像生成编码器获得所述图像的特征向量;将所述图像的特征向量输入到语义分离器获得所述图像的语义标签。3.根据权利要求1所述的图像处理方法,其特征在于,所述对所述图像中的物像进行检测,具体包括:对所述图像中的物像进行检测,获取所述物像的名称及物象框位置。4.根据权利要求3所述的图像处理方法,其特征在于,所述物象框位置通过将所述图像输入到目标检测网络获得,所述目标检测网络包括骨架网络、颈部网络和头部网络,具体包括:将所述图像输入到所述骨架网络提取特征;将所述特征输入到所述颈部网络得到不同尺度的特征图集合;将所述不同尺度的特征图集合输入到所述头部网络生成预测框,并根据所述预测框的置信度确定所述物象框位置。5.根据权利要求3所述的图像处理方法,其特征在于,所述计算所述物像与所述语义标签的相关度,具体包括:将所述物像的名称输入到词向量网络获得第一词向量;将所述语义标签输入到词向量网络获得第二词向量;将所述第一词向量及所述第二词向量输入到相关度分类器获得所述物像与所述语义标签的相关度。6.根据权利要求3所述的图像处理方法,其特征在于,所述将达到预设相关度...

【专利技术属性】
技术研发人员:郝德禄肖冠正甘心
申请(专利权)人:天翼爱音乐文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1