神经网络训练方法及装置、电子设备和存储介质制造方法及图纸

技术编号:21344309 阅读:29 留言:0更新日期:2019-06-13 22:46
本公开涉及一种神经网络训练方法及装置、电子设备和存储介质,所述方法包括:对多个第一样本图像进行筛选,从多个第一样本图像中确定出已标注的多个第二样本图像;根据多个第二样本图像中被标注为第一类别的第三样本图像,生成多个第四样本图像,第四样本图像被标注为第一类别;根据已标注的多个第二样本图像和多个第四样本图像,训练诊断网络。根据本公开的实施例的神经网络训练方法,可对多个第一样本图像进行筛选,获得已标注的第二样本图像,可降低标注成本,并可生成第四样本图像,可增加第一类别的样本数量,扩大样本总数,并使第一类别和第二类别的样本数量均衡,提高训练效果。

Neural Network Training Method and Device, Electronic Equipment and Storage Media

The present disclosure relates to a neural network training method and device, an electronic device and a storage medium. The method includes: screening multiple first sample images, determining multiple second sample images labeled from multiple first sample images, generating multiple fourth sample images according to the third sample images labeled as the first category in multiple second sample images, and generating multiple fourth sample images. Sample images are labeled as the first category, and diagnostic networks are trained according to the labeled second and fourth sample images. According to the embodiment of the present disclosure, the neural network training method can filter multiple first sample images, obtain the labeled second sample images, reduce the labeling cost, and generate the fourth sample images, increase the number of samples in the first category, enlarge the total number of samples, and make the number of samples in the first category and the second category equalize, and improve the training effect.

【技术实现步骤摘要】
神经网络训练方法及装置、电子设备和存储介质
本公开涉及计算机
,尤其涉及一种神经网络训练方法及装置、电子设备和存储介质。
技术介绍
在相关技术中,在训练神经网络的过程中,可能出现样本量不足和样本标注代价成本的情况,导致训练效果不佳。例如,医学图像需要专业医生标注,成本较高,且健康的人很少进行医学检查,获取医学图像,导致医学图像中的负样本数量较少,使得正负样本数量不均衡,导致训练效果较差。
技术实现思路
本公开提出了一种神经网络训练方法及装置、电子设备和存储介质。根据本公开的一方面,提供了一种神经网络训练方法,包括:对多个第一样本图像进行筛选,从所述多个第一样本图像中确定出已标注的多个第二样本图像,所述多个第二样本图像被标注为第一类别或第二类别;根据所述多个第二样本图像中被标注为第一类别的第三样本图像,生成多个第四样本图像,所述第四样本图像被标注为第一类别;根据已标注的多个第二样本图像和所述多个第四样本图像,训练诊断网络,其中,所述诊断网络用于确定待处理图像的类别。根据本公开的实施例的神经网络训练方法,可对多个第一样本图像进行筛选,获得已标注的第二样本图像,可降低标注成本,并可生成第本文档来自技高网...

【技术保护点】
1.一种神经网络训练方法,其特征在于,包括:对多个第一样本图像进行筛选,从所述多个第一样本图像中确定出已标注的多个第二样本图像,所述多个第二样本图像被标注为第一类别或第二类别;根据所述多个第二样本图像中被标注为第一类别的第三样本图像,生成多个第四样本图像,所述第四样本图像被标注为第一类别;根据已标注的多个第二样本图像和所述多个第四样本图像,训练诊断网络,其中,所述诊断网络用于确定待处理图像的类别。

【技术特征摘要】
1.一种神经网络训练方法,其特征在于,包括:对多个第一样本图像进行筛选,从所述多个第一样本图像中确定出已标注的多个第二样本图像,所述多个第二样本图像被标注为第一类别或第二类别;根据所述多个第二样本图像中被标注为第一类别的第三样本图像,生成多个第四样本图像,所述第四样本图像被标注为第一类别;根据已标注的多个第二样本图像和所述多个第四样本图像,训练诊断网络,其中,所述诊断网络用于确定待处理图像的类别。2.根据权利要求1所述的方法,其特征在于,所述多个第一样本图像包括已标注的样本图像和未标注的样本图像,已标注的样本图像组成第一训练集,未标注的样本图像组成第二训练集,其中,对多个第一样本图像进行筛选,从所述多个第一样本图像中确定出已标注的多个第二样本图像,包括:根据所述第一训练集训练样本选择网络,得到当前训练状态的样本选择网络;通过所述当前训练状态的样本选择网络对所述第二训练集中的样本图像进行筛选,得到待标注的多个第五样本图像;将已标注的多个第五样本图像加入所述第一训练集,并将所述多个第五样本图像从所述第二训练集中去除;根据所述第一训练集再次训练所述样本选择网络,得到下一个训练状态的样本选择网络;在满足预设的第一训练条件的情况下,得到目标状态的第一训练集,所述目标状态的第一训练集中包括已标注的多个第二样本图像。3.根据权利要求2所述的方法,其特征在于,通过所述当前训练状态的样本选择网络对所述第二训练集中的样本图像进行筛选,得到待标注的多个第五样本图像,包括:通过样本选择网络对第二训练集的多个样本图像分别进行处理,获得各个样本图像属于第一类别的第一概率及属于第二类别的第二概率;根据所述第一概率和第二概率,分别确定第二训练集的多个样本图像的信息熵;根据多个样本图像的信息熵,从第二训练集的多个样本图像中确定所述第五样本图像。4.根据权利要求1-3中任一项所述的方法,其特征在于,根据所述多个第二样本图像中被标注为第一类别的第三样本图像,通过数据增强...

【专利技术属性】
技术研发人员:王哲王占宇曲国祥李飞袁野林顺潮张秀兰乔宇
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1