The invention discloses a head and shoulder partial image segmentation method based on the attention model, which includes the following steps: Step 1, obtain a picture data set for training, and annotate the picture; step two, expand the data set for the training sample and get the data set; step three, design the neural network structure, and take the steps. Two the data set is trained as the training sample, and the network training is carried out; step four, extracting the network model; step five, the picture to be tested for the face area detection, get the two-dimensional map, and input the original map and the obtained two-dimensional map to the network model extracted by step four to calculate, through the end to end extraction. The image of the head and shoulders is segmented and the segmentation result is obtained. The invention realizes the head to shoulder segmentation algorithm with end to end automation, and solves the problem of the need for pre artificial marking in the traditional foreground extraction problem.
【技术实现步骤摘要】
一种基于注意力模型的头肩部分图像分割方法及装置
本专利技术涉及图像分割
,尤其涉及一种基于注意力模型的头肩部分图像分割方法。
技术介绍
头肩分割是特定任务下的一种前景提取技术。前景提取(matting),是计算机图像处理中的一个操作,目的是把一幅图像中人们感兴趣的区域提取出来,以便更换背景或做其他操作。但是确定一个像素属于前景还是背景却是一个病态的问题,这无疑给前景提取带来了巨大的挑战。前景提取将图像归为3类:确定的前景、确定的背景和未知区域,未知区域中的像素既受到前景像素的影响,也受到背景像素的影响。所以,对于未知像素中一个像素p(x,y),其颜色可以表示为:C=αF+(1-α)BF表示(x,y)处前景的颜色,B表示(x,y)处背景的颜色。α可以理解为前景的透明度,取值范围0到1之间。该问题是已知1个方程,来求3个未知数。显而易见,这是一个病态的问题,不存在一个确定的解,这无疑给前景提取带来了巨大的挑战。现在一般的解决方案有:1、由用户先标记trimap图或stroke图,再通过概率、统计等方法来计算α、F和B,从而最终提取出前景。2、先分割得到三分图或二分图再经过微调的到最终的matte。随着数字图像的发展,使用抠图技术合成更有意义的图片吸引了越来越多的用户需求。随着多媒体、网络的快速发展,影视特效,表情包制作,视频聊天、网络直播、搞怪视频等各个领域对智能抠图的需求越来越强烈。但是如何让计算机自动得将人物精准得提取出来,一直是当前待解决的难题。
技术实现思路
为了解决上述技术所存在的不足之处,本专利技术提供了一种基于注意力模型的头肩部分图像分割方法及 ...
【技术保护点】
一种基于注意力模型的头肩部分图像分割方法,其特征在于,包括以下步骤:步骤一、获取用于训练的图片数据集,并对图片进行标注;步骤二、对训练样本进行数据拓充,得到的数据集;步骤三、设计神经网络结构,将步骤二得到的数据集作为训练样本,进行网络训练;步骤四、待测试的图片进行人脸区域检测,得到二维图谱;并将原图以及得到的二维图谱输入步骤三训练后的网络模型进行前向计算,通过端到端的提取方式将待测试图片中的头肩部分图像分割出来,得到分割结果图。
【技术特征摘要】
1.一种基于注意力模型的头肩部分图像分割方法,其特征在于,包括以下步骤:步骤一、获取用于训练的图片数据集,并对图片进行标注;步骤二、对训练样本进行数据拓充,得到的数据集;步骤三、设计神经网络结构,将步骤二得到的数据集作为训练样本,进行网络训练;步骤四、待测试的图片进行人脸区域检测,得到二维图谱;并将原图以及得到的二维图谱输入步骤三训练后的网络模型进行前向计算,通过端到端的提取方式将待测试图片中的头肩部分图像分割出来,得到分割结果图。2.根据权利要求1所述的图像分割方法,其特征在于,还包括以下步骤:步骤五、对步骤四得到的分割结果图运用导向滤波对细节进行优化。3.根据权利要求1或2所述的图像分割方法,其特征在于:所述步骤一中的标注的方法为:手动勾勒人物边缘,得到三分图;将原图和三分图两张图作为输入,使用KNN算法得到其蒙版图;同时,对原图的人脸区域进行定位,将头部区域赋值为1,其他区域赋值为0,存储为灰度图像。4.根据权利要求1-3中任一条所述的图像分割方法,其特征在于:所述步骤二中的数据拓充方法为:对已经标注好的图片进行背景切换;和对已经标注好的图片进行变化光照、增加遮挡以及添加噪声。5.根据权利要求1-4中任一条所述的图像分割方法,其特征在于:所述步骤三中的神经网络为轻量级分割网络,在网络中以人物的脸部关键信息为注意力进行网络模型建模,所述神经网络包括6个依次级联的卷积网络基本单元,每个单元由依次连...
【专利技术属性】
技术研发人员:李珊如,刘昕,袁基睿,山世光,
申请(专利权)人:中科视拓北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。