【技术实现步骤摘要】
卷积神经网络的训练方法、装置、设备和存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种卷积神经网络的训练方法、装置、设备和存储介质。
技术介绍
[0002]近年来,深度学习方法在图像目标识别方面取得了突出的成绩,将卷积神经网络模型应用到生产生活中是当今一大趋势。当前,应用卷积神经网络模型完成目标识别任务,主要依赖于全监督学习,即训练过程中需要使用大量的人工标注数据来训练网络,标注数据需要包含注释定位目标的目标边界框。当遇到标注数据量不足,或是训练数据与测试数据属于不同领域的情况时,卷积神经网络模型的检测效果会不佳。数据集的标注是一项费事费力的工作,对于形态复杂、种类繁多的视觉目标进行精确的样本标注,需要耗费大量人工劳动,训练效率低。
技术实现思路
[0003]本申请实施例通过提供一种卷积神经网络的训练方法、装置、设备和存储介质,解决了现有技术中卷积神经网络在训练中需要对目标进行大量地标注,从而引发的训练效率低的技术问题,实现了充分利用无标注数据进行卷积神经网络训练,降低卷积神经网络的训练成本, ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络的训练方法,其特征在于,包括:通过已获取的第一训练数据集进行模型训练,得到教学模型,其中,所述第一训练数据集为携带人工标注的图像;利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,其中,所述第二训练数据集中每个训练数据为待识别图像,所述目标训练数据集中每个训练数据携带有预测标签;将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集;根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型。2.如权利要求1所述的方法,其特征在于,所述利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,包括:将所述第二训练数据集中的每个训练数据输入到所述教学模型中进行预测,得到标注训练数据集,其中,所述标注训练数据集中每个训练数据包括预测框信息、预测框的置信度和分类信息;从所述标注训练数据集中获取目标训练数据集,其中,所述目标训练数据集中的每个训练数据的所述预测框的置信度不小于置信度阈值,并且将每个训练数据的所述预测框信息、所述预测框的置信度和所述分类信息生成每个训练数据的预测标签。3.如权利要求1所述的方法,其特征在于,所述将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集,包括:从所述第一训练数据集和所述第二数据集中选取N个数据子集,其中,所述N个数据子集中的每个数据子集为包括至少4张图像的数据集,N≥2;针对所述每个数据子集,对数据子集中的图像进行组合处理,生成一张组合图像;其中,所述组合处理作为所述增强处理;对所述每个数据子集进行上述操作之后,得到N张组合图像,其中,所述N张组合图像作为所述第三训练数据集。4.如权利要求3所述的方法,其特征在于,所述根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型,包括:根据所述第三训练数据集对所述初始检测器模型进行迭代训练,直至迭代的检测器模型对应的损...
【专利技术属性】
技术研发人员:王章君沛,李功燕,许绍云,
申请(专利权)人:中国科学院微电子研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。