神经网络训练方法、装置、计算机设备及可读介质制造方法及图纸

技术编号:20797829 阅读:38 留言:0更新日期:2019-04-06 11:27
本发明专利技术公开了一种神经网络训练方法及装置,涉及机器学习领域,该方法包括:将第n图像数据库中的无标签图像数据输入第n神经网络,提取得到无标签图像数据的第n特征;将无标签图像数据输入第n+1神经网络提取得到无标签图像数据的第n+1特征;根据第n特征以及第n+1特征确定出符合预设要求的无标签图像数据,对符合预设要求的无标签图像数据标注伪标签;更新得到第n+1图像数据库;根据第n+1图像数据库对第n+1神经网络进行训练,得到第n+2神经网络。通过两个神经网络对无标签图像数据进行选择,并对选择得到的无标签图像数据标注伪标签,从而增加了对神经网络进行训练的有标签图像数据的数量,提高了神经网络的精确度。

Neural Network Training Method, Device, Computer Equipment and Readable Media

The invention discloses a neural network training method and device, which relates to the field of machine learning. The method includes: input the unlabeled image data in the N image database into the n-th neural network to extract the n-th feature of the unlabeled image data; input the unlabeled image data into the n+1 neural network to extract the n+1 feature of the unlabeled image data; and extract the n+1 feature of the unlabeled image data according to the n-th feature and the n-th The n+1 feature determines the unlabeled image data that meets the preset requirements, labels the unlabeled image data that meets the preset requirements, updates the n+1 image database, trains the n+1 neural network according to the n+1 image database, and obtains the n+2 neural network. The labeled image data are selected by two neural networks, and the labeled image data are labeled with false labels, which increases the number of labeled image data trained by the neural network and improves the accuracy of the neural network.

【技术实现步骤摘要】
神经网络训练方法、装置、计算机设备及可读介质
本申请实施例涉及机器学习领域,特别涉及一种神经网络训练方法、装置、计算机设备及可读介质。
技术介绍
图像识别技术是机器学习领域中的一项基础研究话题,通过给定的图像数据,可以通过神经网络识别出该图像数据中的物体的类别。物体的类别可以是人物、猫、狗、家居、建筑等。在对图像数据进行识别之前,首先需要对神经网络进行训练。相关技术中提供的神经网络训练方法包括:将有标签图像数据输入到神经网络中,有标签图像数据是指与该图像数据对应存储有对物体的类别进行标识的标签的图像数据,通过神经网络得到该有标签图像数据的预测标签,并与该有标签图像数据的标签进行比较,根据比较得到的误差结果对神经网络进行调整。然而,给定的图像数据库中往往半数以上都是无标签图像数据,由于无标签图像数据无法被应用到对神经网络的训练当中,所以无标签图像数据无法用于提高神经网络的识别精确度。
技术实现思路
本申请实施例提供了一种神经网络训练方法、装置、计算机设备及可读介质,可以解决无标签图像数据无法应用于对神经网络进行训练的问题。所述技术方案如下:第一方面,提供一种神经网络训练方法,所述方法,包括本文档来自技高网...

【技术保护点】
1.一种神经网络的训练方法,其特征在于,所述方法包括:将第n图像数据库中的无标签图像数据输入第n神经网络,提取得到所述无标签图像数据的第n特征,其中n≥1;将所述无标签图像数据输入第n+1神经网络提取得到所述无标签图像数据的第n+1特征;根据所述第n特征以及所述第n+1特征确定出符合预设要求的所述无标签图像数据;根据所述第n图像数据库中的有标签图像数据的标签,对符合预设要求的所述无标签图像数据标注伪标签;将所述第n图像数据库中被标注有所述伪标签的所述无标签图像数据更新为所述有标签图像数据,得到第n+1图像数据库;根据所述第n+1图像数据库对所述第n+1神经网络进行训练,得到第n+2神经网络。

【技术特征摘要】
1.一种神经网络的训练方法,其特征在于,所述方法包括:将第n图像数据库中的无标签图像数据输入第n神经网络,提取得到所述无标签图像数据的第n特征,其中n≥1;将所述无标签图像数据输入第n+1神经网络提取得到所述无标签图像数据的第n+1特征;根据所述第n特征以及所述第n+1特征确定出符合预设要求的所述无标签图像数据;根据所述第n图像数据库中的有标签图像数据的标签,对符合预设要求的所述无标签图像数据标注伪标签;将所述第n图像数据库中被标注有所述伪标签的所述无标签图像数据更新为所述有标签图像数据,得到第n+1图像数据库;根据所述第n+1图像数据库对所述第n+1神经网络进行训练,得到第n+2神经网络。2.根据权利要求1所述的方法,其特征在于,所述根据所述第n特征以及所述第n+1特征确定出符合预设要求的所述无标签图像数据,包括:对所述无标签图像数据的所述第n特征以及所述第n+1特征之间的差异进行量化,得到信任度值;将所述信任度值大于预设阈值的所述无标签图像数据,确定为符合预设要求的所述无标签图像数据。3.根据权利要求1所述的方法,其特征在于,所述根据所述第n图像数据库中的有标签图像数据的标签,对符合预设要求的所述无标签图像数据标注伪标签,包括:根据所述有标签图像数据的标签,从标签库中选择所述无标签图像数据对应的k个候选伪标签;分别计算所述k个候选伪标签与所述第n特征对应的第一权重;分别计算所述k个候选伪标签与所述第n+1特征对应的第二权重;根据所述第一权重和所述第二权重选择所述k个候选伪标签中的第i个伪标签为目标伪标签;对所述无标签图像数据标注所述目标伪标签。4.根据权利要求3所述的方法,其特征在于,所述根据所述第n图像数据库中的有标签图像数据的标签,从标签库中选择所述无标签图像数据的k个候选伪标签,包括:从所述第n神经网络对应的第n特征空间中,获取所述第n特征的预设距离范围内的第n’特征,所述第n’特征是将所述有标签图像数据输入所述第n神经网络后得到的特征;根据每个所述第n’特征分别对所述标签库中的标签进行投票,得到第一投票结果;从所述第n+1神经网络对应的所述第n+1特征空间中,获取所述第n+1特征的所述预设距离范围内的第n’+1特征;根据每个所述第n’+1特征分别对所述标签库中的标签进行投票,得到第二投票结果;根据所述第一投票结果和所述第二投票结果,确定出被投票次数最多的k个标签,确定为所述无标签图像数据的k个候选伪标签。5.根据权利要求3所述的方法,其特征在于,所述分别计算所述k个候选伪标签与所述第n特征对应的第一权重,包括:根据近邻内嵌变化算法分别计算所述k个候选伪标签与所述第n特征对应的第一概率;根据近邻类别变化算法分别计算所述k个候选伪标签与所述第n特征对应的第三权重;并根据所述k个候选伪标签中每个候选伪标签的所述第一概率和所述第三权重,计算所述k个候选伪标签中每个候选伪标签与所述第n特征对应的第一权重。6.根据权利要求3所述的方法,其特征在于,所述分别计算所述k个候选伪标签与所述第n+1特征对应的第二权重,包括:根据近邻内嵌变化算法分别计算所述k个候选伪标签与所述第n+1特征对应的第二概率;根据近邻类别...

【专利技术属性】
技术研发人员:陈子良王可泽林倞彭湃郭晓威余伟江
申请(专利权)人:腾讯科技深圳有限公司中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1