一种图像处理方法及装置制造方法及图纸

技术编号:18352015 阅读:27 留言:0更新日期:2018-07-02 02:21
本发明专利技术公开了一种图像处理方法及装置,其中,该方法包括:读取一张待合成图像;读取一张待抠取图像,对图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录二值化图像的目标轮廓信息;以及读取目标轮廓信息以在待合成图像中生成合成图像位置,在合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件;其中,预先设置待抠取图像中目标物体类别的编号及目标类别的名称,并且类别编号和类别名称一一对应。通过本发明专利技术,利用图像抠图及合成,获得深度学习所需的图像数据及对应标签的自动生成。

【技术实现步骤摘要】
一种图像处理方法及装置
本专利技术涉及图像处理领域,特别涉及一种图像处理方法及装置。
技术介绍
当前的图像抠图及合成方法针对的是复杂背景图像,因此大都比较复杂;当前深度学习模型(针对图像有关的分类、检测等任务)的训练数据(图像)通常需要人工拍摄,而同一个目标物体在不同场景下,通常会出现重复拍摄的问题(如某瓶可乐在冰箱内和在桌面上的不同场景下,其摆放形态可能一样,但其图像数据需分别进行拍摄);针对深度学习模型中的图像目标检测任务,训练数据除了图像本身外,还需要图像标签(包括图像的名称、图像中包含的目标物体的类别名称、目标物体的位置),这些标签通常需要人工标注,需耗费大量的精力和时间。
技术实现思路
本专利技术主要解决的技术问题是提供一种图像处理方法及装置,以通过图像抠图及合成,获得深度学习所需的图像数据及对应标签的自动生成。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种图像处理方法,所述方法包括:读取一张待合成图像;读取一张待抠取图像,对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息;以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件;其中,预先设置待抠取图像中目标物体类别的编号及目标类别的名称,并且类别编号和类别名称一一对应。其中,读取一张待抠取图像,对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息,具体包括:读取所述待抠取图像,对所述图像拆分为R、G、B三个通道下的图像;分别计算三个通道图像的边缘像素的平均值,并判断所述平均值是否大于阈值;当所述平均值大于阈值时将像素值大于平均值的像素值设为0,小于平均值的像素值设为255;当所述平均值不大于所述阈值时将像素小于所述平均值的像素设为0,大于所述平均值的像素设为255;将三个通道下二值化后的图像进行合并,以得到叠加后的二值化图像;以及记录得到的所述二值化图像的目标轮廓信息。其中,记录得到的所述二值化图像的目标轮廓信息之前,所述方法还包括:通过腐蚀、膨胀、提取所述二值化图像的轮廓并填充;判断经过处理后的所述二值化图像是否存在背景残留;在确定所述二值化图像存在背景残留时剔除残留背景。其中,记录得到的所述二值化图像的目标轮廓信息,具体为:用矩形框框住所述目标轮廓,并记录所述矩形框的左上角坐标及所述矩形框的长和宽,得到所述二值化图像的目标轮廓信息。其中,读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件,具体包括:读取待合成图像以及所述目标轮廓信息;在所述待合成图像上确定目标图像的放置位置;根据记录所述目标轮廓信息的矩形的长和宽判断是否超出所述待合成图像的边界;当确定超出所述待合成图像的边界时重新在所述待合成图像上确定目标图像的放置位置;当确定没有超出所述待合成图像的边界时,判断所述目标图像放置位置的重叠率是否小于阈值;当确定所述重叠率不小于阈值时重新在所述待合成图像上确定目标图像的放置位置;当确定所述重叠率小于阈值时在生成的位置上放置抠取的目标,以生成合成图像,并将目标类别及生成的位置保存为标签文件。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种图像处理装置,所述装置包括:图像获取单元,用于读取待合成图像以及待抠取图像;图像抠取单元,用于对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息;以及图像合成单元,用于读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件;其中,预先设置待抠取图像中目标物体类别的编号及目标类别的名称,并且类别编号和类别名称一一对应。其中,所述图像抠取单元包括:通道拆分模块,用于对读取的所述图像拆分为R、G、B三个通道下的图像;计算模块,用于分别计算三个通道图像的边缘像素的平均值;二值化模块,用于在所述平均值大于阈值时将像素值大于平均值的像素值设为0,小于平均值的像素值设为255;以及在所述平均值不大于所述阈值时将像素小于所述平均值的像素设为0,大于所述平均值的像素设为255;合并模块,用于将三个通道下二值化后的图像进行合并,以得到叠加后的二值化图像;以及轮廓记录模块,用于记录得到的所述二值化图像的目标轮廓信息。其中,所述图像抠取单元还包括:轮廓处理模块,用于通过腐蚀、膨胀、提取所述二值化图像的轮廓并填充,并对经过处理后的所述二值化图像残留的背景进行剔除。其中,所述轮廓记录模块具体用于用矩形框框住所述目标轮廓,并记录所述矩形框的左上角坐标及所述矩形框的长和宽,得到所述二值化图像的目标轮廓信息。其中,所述图像合成单元包括:位置生成模块,用于在所述待合成图像上确定目标图像的放置位置;判断模块,用于:根据记录所述目标轮廓信息的矩形的长和宽判断是否超出所述待合成图像的边界;当确定超出所述待合成图像的边界时触发所述位置生成模块重新在所述待合成图像上确定目标图像的放置位置;当确定没有超出所述待合成图像的边界时,判断所述目标图像放置位置的重叠率是否小于阈值;当确定所述重叠率不小于阈值时触发所述位置生成模块重新在所述待合成图像上确定目标图像的放置位置;当确定所述重叠率小于阈值时产生触发信号;目标图像合成模块,用于响应所述触发信号在生成的位置上放置抠取的目标,以生成合成图像,并将目标类别及生成的位置保存为标签文件。以上方案中,本专利技术通过在拍摄待合成目标时,先使用简单的、单一化的背景(只采用黑色或者白色背景)拍摄目标,便于后续的目标抠取与合成;针对图像采集时,在多个场景下的重复拍摄问题,通过自动抠取图像,并与其他背景图像进行自动合成来解决,一次拍摄即可快速用于不同的应用场景;针对目标检测任务中,深度学习训练图像的样本标签需人工标注的问题,通过合成图像时,记录合成图像信息(合成图像名称、目标类别、目标位置),实现自动生成训练图像标签的方法来解决,能够极大降低人工标注工作量,提高深度学习训练效率。采用合成的图像及自动生成的样本标签,针对深度学习模型进行有效训练,通过将合成图像数据与真实场景下的标注数据按一定的比例混合使用,可以进一步提高模型训练的准确率。附图说明图1是本专利技术实施方式中的一种图像处理方法的流程示意图;图2是图1所示的图像合成方法的流程示意图;图3是图1所示的图像抠取方法的流程示意图;图4是利用本专利技术进行图像轮廓提取过程的示意图;图5是利用本专利技术进行合成图像的示意图;图6是利用本专利技术合成图像的坐标示意图;图7是本专利技术实施方式中的一种图像处理装置的结构示意图;图8是本专利技术实施方式中的图像抠取本文档来自技高网...
一种图像处理方法及装置

【技术保护点】
1.一种图像处理方法,其特征在于,所述方法包括:读取一张待合成图像;读取一张待抠取图像,对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息;以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件;其中,预先设置待抠取图像中目标物体类别的编号及目标类别的名称,并且类别编号和类别名称一一对应。

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:读取一张待合成图像;读取一张待抠取图像,对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息;以及读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件;其中,预先设置待抠取图像中目标物体类别的编号及目标类别的名称,并且类别编号和类别名称一一对应。2.根据权利要求1所述的图像处理方法,其特征在于,读取一张待抠取图像,对所述图像进行RGB通道拆分以分别计算三个通道图像的边缘像素平均值,利用所述平均值对三个通道的图像进行二值化处理,并将三个通道的二值化图像合并得到叠加后的二值化图像,从而记录所述二值化图像的目标轮廓信息,具体包括:读取所述待抠取图像,对所述图像拆分为R、G、B三个通道下的图像;分别计算三个通道图像的边缘像素的平均值,并判断所述平均值是否大于阈值;当所述平均值大于阈值时将像素值大于平均值的像素值设为0,小于平均值的像素值设为255;当所述平均值不大于所述阈值时将像素小于所述平均值的像素设为0,大于所述平均值的像素设为255;将三个通道下二值化后的图像进行合并,以得到叠加后的二值化图像;以及记录得到的所述二值化图像的目标轮廓信息。3.根据权利要求2所述的图像处理方法,其特征在于,记录得到的所述二值化图像的目标轮廓信息之前,所述方法还包括:通过腐蚀、膨胀、提取所述二值化图像的轮廓并填充;判断经过处理后的所述二值化图像是否存在背景残留;在确定所述二值化图像存在背景残留时剔除残留背景。4.根据权利要求2所述的图像处理方法,其特征在于,记录得到的所述二值化图像的目标轮廓信息,具体为:用矩形框框住所述目标轮廓,并记录所述矩形框的左上角坐标及所述矩形框的长和宽,得到所述二值化图像的目标轮廓信息。5.根据权利要求4所述的图像处理方法,其特征在于,读取所述目标轮廓信息以在所述待合成图像中生成合成图像位置,在所述合成图像位置上放置待抠取图像以生成合成图像,并将目标类别及生成的位置保存为标签文件,具体包括:读取待合成图像以及所述目标轮廓信息;在所述待合成图像上确定目标图像的放置位置;根据记录所述目标轮廓信息的矩形的长和宽判断是否超出所述待合成图像的边界;当确定超出所述待合成图像的边界时重新在所述待合成图像上确定目标图像的放置位置;当确定没有超出所述待合成图像的边界时,判断所述目标图像放置位置的重叠率是否小于阈值;当确定所述重叠率不小于阈值时重新在所述待合成图像上确定目...

【专利技术属性】
技术研发人员:夏远祥张帆谢立寅
申请(专利权)人:厦门华联电子股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1