一种图像处理方法及装置制造方法及图纸

技术编号：18352015 阅读：27 留言：0更新日期：2018-07-02 02:21

本发明专利技术公开了一种图像处理方法及装置，其中，该方法包括：读取一张待合成图像；读取一张待抠取图像，对图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值，利用平均值对三个通道的图像进行二值化处理，并将三个通道的二值化图像合并得到叠加后的二值化图像，从而记录二值化图像的目标轮廓信息；以及读取目标轮廓信息以在待合成图像中生成合成图像位置，在合成图像位置上放置待抠取图像以生成合成图像，并将目标类别及生成的位置保存为标签文件；其中，预先设置待抠取图像中目标物体类别的编号及目标类别的名称，并且类别编号和类别名称一一对应。通过本发明专利技术，利用图像抠图及合成，获得深度学习所需的图像数据及对应标签的自动生成。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像处理方法及装置
本专利技术涉及图像处理领域，特别涉及一种图像处理方法及装置。
技术介绍
当前的图像抠图及合成方法针对的是复杂背景图像，因此大都比较复杂；当前深度学习模型(针对图像有关的分类、检测等任务)的训练数据(图像)通常需要人工拍摄，而同一个目标物体在不同场景下，通常会出现重复拍摄的问题(如某瓶可乐在冰箱内和在桌面上的不同场景下，其摆放形态可能一样，但其图像数据需分别进行拍摄)；针对深度学习模型中的图像目标检测任务，训练数据除了图像本身外，还需要图像标签(包括图像的名称、图像中包含的目标物体的类别名称、目标物体的位置)，这些标签通常需要人工标注，需耗费大量的精力和时间。
技术实现思路
本专利技术主要解决的技术问题是提供一种图像处理方法及装置，以通过图像抠图及合成，获得深度学习所需的图像数据及对应标签的自动生成。为解决上述技术问题，本专利技术采用的一个技术方案是：提供一种图像处理方法，所述方法包括：读取一张待合成图像；读取一张待抠取图像，对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值，利用所述平均值对三个通道的图像进行二值化处理，并将三个通道的二值化图像合并得到叠加后的二值化图像，从而记录所述二值化图像的目标轮廓信息；以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置，在所述合成图像位置上放置待抠取图像以生成合成图像，并将目标类别及生成的位置保存为标签文件；其中，预先设置待抠取图像中目标物体类别的编号及目标类别的名称，并且类别编号和类别名称一一对应。其中，读取一张待抠取图像，对所述图像进行RGB通道拆分以分别计算三个通道...
一种图像处理方法及装置

【技术保护点】
1.一种图像处理方法，其特征在于，所述方法包括：读取一张待合成图像；读取一张待抠取图像，对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值，利用所述平均值对三个通道的图像进行二值化处理，并将三个通道的二值化图像合并得到叠加后的二值化图像，从而记录所述二值化图像的目标轮廓信息；以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置，在所述合成图像位置上放置待抠取图像以生成合成图像，并将目标类别及生成的位置保存为标签文件；其中，预先设置待抠取图像中目标物体类别的编号及目标类别的名称，并且类别编号和类别名称一一对应。

【技术特征摘要】
1.一种图像处理方法，其特征在于，所述方法包括：读取一张待合成图像；读取一张待抠取图像，对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值，利用所述平均值对三个通道的图像进行二值化处理，并将三个通道的二值化图像合并得到叠加后的二值化图像，从而记录所述二值化图像的目标轮廓信息；以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置，在所述合成图像位置上放置待抠取图像以生成合成图像，并将目标类别及生成的位置保存为标签文件；其中，预先设置待抠取图像中目标物体类别的编号及目标类别的名称，并且类别编号和类别名称一一对应。2.根据权利要求1所述的图像处理方法，其特征在于，读取一张待抠取图像，对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值，利用所述平均值对三个通道的图像进行二值化处理，并将三个通道的二值化图像合并得到叠加后的二值化图像，从而记录所述二值化图像的目标轮廓信息，具体包括：读取所述待抠取图像，对所述图像拆分为R、G、B三个通道下的图像；分别计算三个通道图像的边缘像素的平均值，并判断所述平均值是否大于阈值；当所述平均值大于阈值时将像素值大于平均值的像素值设为0，小于平均值的像素值设为255；当所述平均值不大于所述阈值时将像素小于所述平均值的像素设为0，大于所述平均值的像素设为255；将三个通道下二值化后的图像进行合并，以得到叠加后的二值化图像；以及记录得到的所述二值化图像的目标轮廓信息。3.根据权利要求2所述的图像处理方法，其特征在于，记录得到的所述二值化图像的目标轮廓信息之前，所述方法还包括：通过腐蚀、膨胀、提取所述二值化图像的轮廓并填充；判断经过处理后的所述二值化图像是否存在背景残留；在确定所述二值化图像存在背景残留时剔除残留背景。4.根据权利要求2所述的图像处理方法，其特征在于，记录得到的所述二值化图像的目标轮廓信息，具体为：用矩形框框住所述目标轮廓，并记录所述矩形框的左上角坐标及所述矩形框的长和宽，得到所述二值化图像的目标轮廓信息。5.根据权利要求4所述的图像处理方法，其特征在于，读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置，在所述合成图像位置上放置待抠取图像以生成合成图像，并将目标类别及生成的位置保存为标签文件，具体包括：读取待合成图像以及所述目标轮廓信息；在所述待合成图像上确定目标图像的放置位置；根据记录所述目标轮廓信息的矩形的长和宽判断是否超出所述待合成图像的边界；当确定超出所述待合成图像的边界时重新在所述待合成图像上确定目标图像的放置位置；当确定没有超出所述待合成图像的边界时，判断所述目标图像放置位置的重叠率是否小于阈值；当确定所述重叠率不小于阈值时重新在所述待合成图像上确定目...

【专利技术属性】
技术研发人员：夏远祥，张帆，谢立寅，
申请(专利权)人：厦门华联电子股份有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人