【技术实现步骤摘要】
数据增强方法、训练方法、计算机装置及存储介质
本申请实施例涉及人工智能
,尤其涉及数据增强方法、训练方法、计算机装置及存储介质。
技术介绍
在众多计算机视觉应用场景中,例如目标识别等,目标检测是其重要的前置步骤。具体的,通过处理所采集图像中的目标相关特征以定位目标所在区域。所述目标可以是人、物等。在目标检测中会用到目标检测模型,例如深度神经网络模型等。这些模型需要通过训练数据进行训练以学习到目标检测的规律。然而,训练数据往往是很有限的,为了克服数据不足的问题,于是产生了数据增强的方法来对现有数据进行多种方式的模拟,以几乎没有成本的方式生成尽可能与真实数据相似的数据,对于图像数据而言,对应数据增强方法可以是对图像进行尺寸变化、角度变化、伸缩、拼接等处理方式实现。虽然现有的数据增强方法可以在很大一部分程度上缓和数据不足的问题,同时避免学习得到的模型过拟合于当前数据,但是使用数据增强方法都较为随意或模式固定,并没有精细到明确需要得到哪些特点的增强数据,以及增强数据的组合等,无法快速灵活地自动产生具有所需特点的 ...
【技术保护点】
1.一种数据增强方法,其特征在于,包括:/n获取待增强数据集;/n生成对应待增强数据集的第一随机值;/n判断所述第一随机值所落入的预设取值范围;/n确定所述预设取值范围预先关联的数据增强操作;/n通过确定的数据增强操作处理所述待增强数据集,获得增强数据集。/n
【技术特征摘要】
1.一种数据增强方法,其特征在于,包括:
获取待增强数据集;
生成对应待增强数据集的第一随机值;
判断所述第一随机值所落入的预设取值范围;
确定所述预设取值范围预先关联的数据增强操作;
通过确定的数据增强操作处理所述待增强数据集,获得增强数据集。
2.根据权利要求1所述的数据增强方法,其特征在于,所述预设取值范围有多个,所述多个预设取值范围之间的大小决定第一随机值落入其中各预设取值范围的概率大小;每个预设取值范围关联有数据增强操作,且所述多个预设取值范围各自所关联的数据增强操作不同。
3.根据权利要求2所述的数据增强方法,其特征在于,各个所述预设取值范围之间间隔或连续。
4.根据权利要求1所述的数据增强方法,其特征在于,所述确定所述预设取值范围预先关联的数据增强操作,包括:
查询同第一随机值所落入的预设取值范围预先建立有关联关系的数据增强操作;
在查询到数据增强操作时,将查询到的数据增强操作确定为与所述预设取值范围关联的数据增强操作。
5.根据权利要求1所述的数据增强方法,其特征在于,所述通过确定的数据增强操作处理所述待增强数据集,获得增强数据集,包括:
获取待增强数据集中的当前待增强图像,所述当前待增强图像具有用于标注目标的增强前标注图像区域;
通过确定的数据增强操作对所述待增强图像进行处理,获得增强图像,所述待增强图像中的增强前标注图像区域变化为所述增强图像中的增强后标注图像区域;其中,所述增强图像归于所述增强数据集。
6.根据权利要求1或5所述的数据增强方法,其特征在于,所述数据增强操作的种类包括以下中的至少一种:对当前待增强图像的无畸变拉长或缩短操作;在长度和/或高度上拉长或缩短操作;对多个已有图像进行拼接或缩小/放大后拼接。
7.根据权利要求6所述的数据增强方法,其特征在于,所述无畸变拉长操作包括:在待增强图像中增强前标注图像区域的至少一侧填充包含相同类型的目标的图像内容,以形成增强后标注图像区域;
所述无畸变缩短操作包括:对待增强图像中增强前标注图像区域进行裁剪以形成增强后标注图像区域;或者对增强前标注图像区域设置分隔的各部分以形成增强后标注图像区域。
8.根据权利要求7所述的数据增强方法,其特征在于,所述包含相同类型的目标的图像内容包括以下至少一种:增强前标注图像区域的一部分;或者,已有图像中的标注图像区域。
9.根据权利要求1所述的数据增强方法,其特征在于,所述数据增强操作还包括以下至少一种处理步骤:
若数据增强操作中对待...
【专利技术属性】
技术研发人员:宁亚光,李兵,刘水,
申请(专利权)人:北京易真学思教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。