获取训练数据的方法、装置及存储介质制造方法及图纸

技术编号:28202578 阅读:29 留言:0更新日期:2021-04-24 14:24
本申请公开了一种获取训练数据的方法及装置,属于深度学习技术领域。在本申请中,接收多张样本图片中的每张样本图片的混合数据,混合数据的数据格式包括第一字段和第二字段。根据混合数据的数据格式,对每张样本图片的混合数据进行拆分,得到每张样本图片对应的第一字段和第二字段。根据每张样本图片对应的第一字段中的第一图片参数,生成相应样本图片的检测图片数据,根据每张样本图片对应的第二字段中的第二图片参数,生成相应样本图片的分类图片数据。因此,本申请中根据混合数据的数据格式可以生成检测图片数据和分类图片数据,无需再从服务器中单独获取分类图片数据,减少了冗余信息的传输,降低了数据的无效传输率,节省了带宽。带宽。带宽。

【技术实现步骤摘要】
获取训练数据的方法、装置及存储介质


[0001]本申请涉及深度学习领域,特别涉及一种获取训练数据的方法、装置及存储介质。

技术介绍

[0002]当前,深度学习技术被广泛的应用于各行各业中。例如,可以通过神经网络模型来进行图片识别。通常,在通过神经网络模型进行图片识别之前,需要使用大量的样本图片和标签作为训练数据来对该神经网络模型进行训练。
[0003]目前对神经网络模型的训练主要包括检测训练和分类训练。为了便于后续描述,将用于进行检测训练的数据称为检测图片数据,将用于进行分类训练的数据称为分类图片数据。相关技术中,第一设备可以根据多张样本图片生成检测图片数据,并将该检测图片数据上传至服务器。与此同时,第一设备可以对多张样本图片中每张样本图片包含的目标区域进行裁剪,得到目标区域图片,之后,根据该目标区域图片生成分类图片数据,并将分类图片数据上传至服务器。后续,当第二设备对神经网络模型进行检测训练时,可以从服务器中获取检测图片数据,当第二设备对神经网络模型进行分类训练时,则可以从服务器中获取分类图片数据。
[0004]由此可见,相关本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种获取训练数据的方法,其特征在于,所述方法包括:接收多张样本图片中每张样本图片的混合数据,所述混合数据的数据格式包括第一字段和第二字段,所述第一字段包括用于生成检测图片数据的第一图片参数,所述第二字段包括用于生成分类图片数据的第二图片参数,所述检测图片数据是指用于进行检测训练的图片数据,所述分类图片数据是指用于进行分类训练的图片数据;根据所述混合数据的数据格式,对每张样本图片的混合数据进行拆分,得到每张样本图片对应的第一字段和第二字段;根据每张样本图片对应的第一字段中的第一图片参数,生成相应样本图片的检测图片数据,根据每张样本图片对应的第二字段中的第二图片参数,生成相应样本图片的分类图片数据。2.根据权利要求1所述的方法,其特征在于,所述第一图片参数包括相应样本图片的网络存储信息、相应样本图片中包含的检测目标的位置信息、标签类别信息,所述检测目标的位置信息是指包含有所述检测目标的目标区域在相应样本图片中的位置信息,所述第二图片参数包括所述检测目标的属性信息。3.根据权利要求2所述的方法,其特征在于,所述根据每张样本图片对应的第一字段中的第一图片参数,生成所述检测图片数据,包括:根据每张样本图片的网络存储信息,下载相应样本图片;存储下载的所述多张样本图片,获取所述多张样本图片中每张样本图片的本地存储地址;根据每张样本图片中的检测目标的位置信息、标签类别信息和相应样本图片的本地存储地址,生成相应样本图片的检测图片数据。4.根据权利要求3所述的方法,其特征在于,所述根据每张样本图片对应的第二字段中的第二图片参数,生成所述分类图片数据,包括:根据每张样本图片中检测目标的位置信息,对相应样本图片进行裁剪,得到包含有所述检测目标的目标区域图片;存储裁剪得到的多张目标区域图片,获取每张目标区域图片的本地存储地址;根据每张样本图片中的检测目标的属性信息和包含有相应检测目标的目标区域图片的本地存储地址,生成相应样本图片的分类图片数据。5.根据权利要求2-4任一所述的方法,其特征在于,所述检测目标的属性信息包括所述检测目标对应的属性数量、每种属性的属性编号和每种属性对应的属性值的值编号。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收所述多张样本图片对应的多条混合标签数据,每条混合标签数据的数据格式均包括第三字段和第四字段,所述第三字段包括用于进行检测训练的检测标签数据,所述第四字段包括用于进行分类训练的分类标签数据;根据每条混合标签数据的数据格式,对每条混合标签数据进行拆分,得到每条混合标签数据中的检测标签数据和分类标签数据。7.根据权利要求6所述的方法,其特征在于,所述检测标签数据包括标签类别和所述标签类别对应的类别编号,所述分类标签数据包括所述标签类别对应的属性信息。8.一种获取训练数据的装置,其特征在于,所述装置包括:
第一接收模块,用于接收多张样本图片中每张样本图片的混合数...

【专利技术属性】
技术研发人员:唐苗
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1