【技术实现步骤摘要】
图像识别方法及装置、电子设备和介质
[0001]本公开涉及人工智能领域,尤其涉及计算机视觉和深度学习
,具体涉及一种图像识别方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]行人检测是计算机视觉技术中的热点和难点,可理解为判断输入图像是否包含行人,如果包含行人,则给出行人的位置信息,近年来,行人检测技术在人体行为分析、视频监控、车辆辅助驾驶及灾难营救等领域发挥了作用。
技术实现思路
[0004]本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,包括:获取第一样本图像集,以基于所述第一样本图像集执行以下训练过程,其中所述第一样本图像集中的每一个样本图像包括待识别目标:基于样本图像经过两次不同的数据增强,以获得第一增强图像和第二增强图像;将所述第一增强图像和所述第二增强图像分别输入第一神经网络和第二神经网络,以分别获得第一图像特征和第二图像特征;将所述第一图像特征和所述第二图像特征组成正样本对、所述第一图像特征与预设的队列中的每一个第二图像特征分别组成负样本对,以基于所述正样本对和所述负样本对计算第一损失函数的值,其中,所述队列中包括在基于所述第一样本图像集的之前训练过程中所获得的第二图像特征;基于所述第一损失函数的值更新所述第一神经网络的参数,并通过动量参数更新方法更新所述第二神经网络的参数;以及将所述样本图像所对应的第二图像特征存入所述队列中;基于训练后的所述第一神经网络和预设的全连接层构建待训练模型;获取用于对所述待训练模型进行训练的第二样本图像集,以执行以下训练过程,其中所述第二样本图像集中的每一个样本图像包括所述待识别目标以及相对应的标签:将样本图像输入所述第一神经网络中,以获得第三图像特征;将所述第三图像特征输入所述全连接层,以获得预测结果;以及基于所述预测结果和所述标签计算第二损失函数的值,以基于所述第二损失函数的值更新所述第一神经网络和所述全连接层的参数。2.如权利要求1所述的方法,还包括:在将当前样本图像经过两次数据增强之前,对所述样本图像进行预处理操作,其中,所述预处理操作包括以下项中的至少一项:将所述样本图像的尺寸进行缩放;将所述样本图像中的像素值进行归一化;将所述样本图像中的每一个像素值减去所述样本图像的像素值均值;以及将所述样本图像中的每一个像素值除以所述样本图像的像素值方差。3.如权利要求1所述的方法,其中,在基于第二样本图像集对所述第一神经网络和所述全连接层进行训练的过程中,所述第一神经网络的学习率小于所述全连接层的学习率。4.如权利要求1所述的方法,其中,所述待识别目标包括行人,并且其中,所述待识别目标相对应的标签包括行人检测框以及所述行人检测框的位置信息。5.如权利要求4所述的方法,其中,所述第二损失函数包括:交叉墒损失函数和L2损失函数。6.如权利要求1所述的方法,其中,所述数据增强包括以下项中的至少一项:随机裁切、随机颜色变换、随机高斯模糊、图像翻转。7.如权利要求1所述的方法,其中,所述第一损失函数为InfoNCE损失函数。8.如权利要求1所述的方法,其中,所述第二样本图像集中的样本图像数量小于所述第一样本图像集中的样本图像数量。9.一种图像识别方法,包括:
获取待识别的图像,其中所述图像包括待识别目标;通过模型对所述待识别的图像进行识别,以获得识别结果,其中,所述模型根据如权利要求1
‑
8中任一项方法训练得到。10.一种模型训练装置,包括:第一训练单元,配置为获取第一样本图像集,以基于所述第一样本图像集执行以下子单元的操作,其中所述第一样本图像集中的每一个样本图像包括待识别目标,所述第一训练单元包括:数据增强子单元,配置为基于样本图像经过两次不同的数据增强,以获得第一增强图像和第二增强图像;第一输入子单元,配置为将所述第一增强图像和所述第二增强图像分别输入第一神经网络和第二神经网络,以分别获得第一图像特征和第二图像特征;计算子单元,配置为将所述第一图像特征和所述第二...
【专利技术属性】
技术研发人员:胡韬,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。