一种数据处理方法和装置、电子设备、存储介质制造方法及图纸

技术编号:29923120 阅读:43 留言:0更新日期:2021-09-04 18:37
本公开提供一种数据处理方法和装置、电子设备、存储介质。包括:响应于接收到对第一数据集进行标注的请求,获取预存的第二数据集,第二数据集包括已标注的至少一个图片,根据第一数据集从至少一个图片中选取目标图片,从第一数据集中选取待标注图片,确定待标注图片的标注区域,根据标注区域对目标图片进行粘贴,对粘贴后的图片进行融合处理,生成标注图片,对标注图片进行显示,通过从已经标注的图片中选取目标图片,以便将目标图片粘贴至待标注图片的标注区域,并对粘贴后的图片进行融合处理,得到标注图片,实现了节约人力和提高标注效率的技术效果,且实现了提高标注的准确性和可靠性的技术效果,且实现了标注的全面性和有效性的技术效果。的技术效果。的技术效果。

【技术实现步骤摘要】
一种数据处理方法和装置、电子设备、存储介质


[0001]本公开涉及互联网
,尤其涉及一种数据处理方法和装置、电子设备、存储介质。

技术介绍

[0002]随着计算机和互联网技术的快速发展和普及,互联网上存在海量的数据,这些数据主要以图片等作为信息载体,对这些信息载体进行标注已成为计算机数据训练的重要基础。
[0003]在现有的技术方案中,在对图片进行标注时,主要通过以下几种方式实现:a、通过人工的方式将各类别的对象的边缘用多边形描绘出来;b、通过半人工的方式进行标注,如将部分标注的数据样本训练得到模型,通过模型对待标注图片进行预测,得到预测结果,通过人工修正的方式对预测结果不正确的待标注图片进行修正;c、通过处理深度图数据,通过聚类和人工的方法对待标注图片进行标注;d、通过风格迁移的方法将目标场景的风格迁移至已有的标注图片上。
[0004]然而专利技术人在实现本公开的过程中,发现至少存在如下问题:采用方式a标注一张图片的时间大约为2个小时,且需要人工参与,因此存在即耗时费力的问题;采用方式b标注一张图片时间大约为1个小时,尽管相较于方式a已有改善,但依然存在耗费时间还是较长,且需要人工参与,耗费人力的问题;采用方式c时,深度图的获取需要依赖高精度的设备,在获取过程中,很难避免因设备本身造成的误差,且通过聚类和人工结合的方式尽管会节约一定的时间,还存在因算法本身造成的标注错误或标注不完全的问题;采用方式d,由于获取的图片与真实图片差很多,很可能造成训练的反面的影响。

技术实现思路

[0005]本公开提供一种数据处理方法和装置、电子设备、存储介质,用以解决上述技术问题中的至少一种。
[0006]一方面,本公开实施例提供一种数据处理方法,所述方法包括:
[0007]响应于接收到对第一数据集进行标注的请求,获取预存的第二数据集,其中,所述第二数据集包括已标注的至少一个图片;
[0008]根据所述第一数据集从所述至少一个图片中选取目标图片;
[0009]从所述第一数据集中选取待标注图片,并确定所述待标注图片的标注区域;
[0010]根据所述标注区域对所述目标图片进行粘贴;
[0011]对粘贴后的图片进行融合处理,生成标注图片,以便对所述标注图片进行显示。
[0012]在一些实施例中,在所述获取预存的第二数据集之前,所述方法还包括:
[0013]获取预存的第三数据集,其中,所述第三数据集中包括已标注的各初始图片,且每个所述初始图片均包括至少一个类别的对象;
[0014]对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理,得到裁剪后的
各图片;
[0015]根据所述裁剪后的各图片构建所述第二数据集。
[0016]在一些实施例中,所述对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理包括:
[0017]针对每个所述初始图片中的任一类别对应的对象,将所述任一类别对应的对象的像素值设置为第一像素值,并将其他类别对应的对象的像素值设置为第二像素值;
[0018]确定所述第一像素值或所述第二像素值对应的联通区域;
[0019]对所述联通区域中的对象进行裁剪处理。
[0020]在一些实施例中,所述确定所述待标注图片的标注区域包括:
[0021]将所述待标注图片划分成预设大小的区域;
[0022]获取所述目标图片在所述第一数据集中的各图片中的位置信息;
[0023]根据所述位置信息从所述区域中选取标注区域。
[0024]在一些实施例中,所述根据所述标注区域对所述目标图片进行粘贴包括:
[0025]获取所述目标图片的中心点;
[0026]根据所述中心点将所述目标图片粘贴至所述目标区域。
[0027]在一些实施例中,所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围,所述根据所述中心点将所述目标图片粘贴至所述目标区域包括:
[0028]在所述目标区域中选取定位点;
[0029]将所述目标图片粘贴至所述目标区域,并将所述中心点与所述定位点位于同一位置;
[0030]从所述高度范围中选取目标高度;
[0031]根据所述目标高度对所述目标图片进行缩放处理。
[0032]在一些实施例中,所述对粘贴后的图片进行融合处理包括:
[0033]根据泊松融合对粘贴后的图片进行融合处理;
[0034]以及,在生成所述标注图片之后,所述方法还包括:
[0035]对所述标注图片中的目标图片的边缘进行高斯模糊处理,得到所述目标标注图片,以便对所述目标标注图片进行显示。
[0036]在一些实施例中,所述至少一个图片、所述目标图片、所述初始图片和所述裁剪后的各图片分别包括label图片和与所述label图片对应的RGB图片。
[0037]另一方面,本公开实施例还提供了一种数据处理装置,所述装置包括:
[0038]第一获取模块,用于响应于接收到对第一数据集进行标注的请求,获取预存的第二数据集,其中,所述第二数据集包括已标注的至少一个图片;
[0039]选取模块,用于根据所述第一数据集从所述至少一个图片中选取目标图片;
[0040]确定模块,用于从所述第一数据集中选取待标注图片,并确定所述待标注图片的标注区域;
[0041]粘贴模块,用于根据所述标注区域对所述目标图片进行粘贴;
[0042]融合模块,用于对粘贴后的图片进行融合处理,生成标注图片,以便对所述标注图片进行显示。
[0043]在一些实施例中,所述装置还包括:
[0044]第二获取模块,用于获取预存的第三数据集,其中,所述第三数据集中包括已标注的各初始图片,且每个所述初始图片均包括至少一个类别的对象;
[0045]裁剪模块,用于对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理,得到裁剪后的各图片;
[0046]构建模块,用于根据所述裁剪后的各图片构建所述第二数据集。
[0047]在一些实施例中,所述裁剪模块用于,针对每个所述初始图片中的任一类别对应的对象,将所述任一类别对应的对象的像素值设置为第一像素值,并将其他类别对应的对象的像素值设置为第二像素值,确定所述第一像素值或所述第二像素值对应的联通区域,对所述联通区域中的对象进行裁剪处理。
[0048]在一些实施例中,所述确定模块用于,将所述待标注图片划分成预设大小的区域,获取所述目标图片在所述第一数据集中的各图片中的位置信息,根据所述位置信息从所述区域中选取标注区域。
[0049]在一些实施例中,所述粘贴模块用于,获取所述目标图片的中心点,根据所述中心点将所述目标图片粘贴至所述目标区域。
[0050]在一些实施例中,所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围,所述粘贴模块用于,在所述目标区域中选取定位点,将所述目标图片粘贴至所述目标区域,并将所述中心点与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应于接收到对第一数据集进行标注的请求,获取预存的第二数据集,其中,所述第二数据集包括已标注的至少一个图片;根据所述第一数据集从所述至少一个图片中选取目标图片;从所述第一数据集中选取待标注图片,并确定所述待标注图片的标注区域;根据所述标注区域对所述目标图片进行粘贴;对粘贴后的图片进行融合处理,生成标注图片,以便对所述标注图片进行显示。2.根据权利要求1所述的方法,其特征在于,在所述获取预存的第二数据集之前,所述方法还包括:获取预存的第三数据集,其中,所述第三数据集中包括已标注的各初始图片,且每个所述初始图片均包括至少一个类别的对象;对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理,得到裁剪后的各图片;根据所述裁剪后的各图片构建所述第二数据集。3.根据权利要求2所述的方法,其特征在于,所述对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理包括:针对每个所述初始图片中的任一类别对应的对象,将所述任一类别对应的对象的像素值设置为第一像素值,并将其他类别对应的对象的像素值设置为第二像素值;确定所述第一像素值或所述第二像素值对应的联通区域;对所述联通区域中的对象进行裁剪处理。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述确定所述待标注图片的标注区域包括:将所述待标注图片划分成预设大小的区域;获取所述目标图片在所述第一数据集中的各图片中的位置信息;根据所述位置信息从所述区域中选取标注区域。5.根据权利要求4所述的方法,其特征在于,所述根据所述标注区域对所述目标图片进行粘贴包括:获取所述目标图片的中心点;根据所述中心点将所述目标图片粘贴至所述目标区域。6.根据...

【专利技术属性】
技术研发人员:余雪兵康勇
申请(专利权)人:北京四维图新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1