【技术实现步骤摘要】
模型训练方法、目标识别方法、装置、电子设备及介质
[0001]本申请涉及计算机视觉
,尤其涉及一种模型训练方法、目标识别方法、装置、电子设备及介质。
技术介绍
[0002]目标识别是一种计算机视觉技术,用于识别图像或视频中的目标,被广泛地应用在各种各样的领域中如无人驾驶视觉检测与导航、眼动追踪、机器人视觉导航和视频监控。目前,机器学习技术已成为解决目标识别问题的普遍方法,但是识别准确性仍然有待提升。
技术实现思路
[0003]本申请提供了一种模型训练方法、目标识别方法、装置、电子设备及介质。
[0004]第一方面,本申请实施例提供了一种模型训练方法,包括:
[0005]获取第一训练数据和第二训练数据,其中,所述第一训练数据包括:多帧第一图像样本以及相应类别标签,所述第二训练数据包括:多帧第二图像样本以及相应类别标签,多帧所述第一图像样本与多帧所述第二图像样本一一对应,所述第一图像样本与相应第二图像样本为同一时间段内采集的同一目标场景的不同种类的视觉信息;
[0006]利用所述第一 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取第一训练数据和第二训练数据,其中,所述第一训练数据包括:多帧第一图像样本以及相应类别标签,所述第二训练数据包括:多帧第二图像样本以及相应类别标签,多帧所述第一图像样本与多帧所述第二图像样本一一对应,所述第一图像样本与相应第二图像样本为同一时间段内采集的同一目标场景的不同种类的视觉信息;利用所述第一训练数据对预设的第一神经网络进行训练,以及利用所述第二训练数据对预设的第二神经网络进行训练,并在训练过程中使得所述第一神经网络和所述第二神经网络相互学习,得到对应于所述第一训练数据的第一目标识别模型以及对应于所述第二训练数据的第二目标识别模型。2.根据权利要求1所述的方法,其特征在于,获取第一训练数据和第二训练数据,包括:采集所述目标场景在同一时间段内的视觉数据集,所述视觉数据集包括:视频图像帧以及事件数据流;按照所述视频图像帧的帧持续时长,对所述事件数据流进行帧重建,形成与所述视频图像帧对应的重建图像帧;将所述视频图像帧作为所述第二图像样本,与所述视频图像帧对应的重建图像帧作为所述第一图像样本,并分别对所述第一图像样本和第二图像样本进行打标。3.根据权利要求2所述的方法,其特征在于,所述采集所述目标场景在同一时间段内的视觉数据集,包括:通过动态有源像素视觉传感器采集所述目标场景在同一时间段内的视频图像帧以及事件数据流,作为所述视觉数据集;或者,通过摄像头以及事件相机分别采集所述目标场景的视觉信息;基于同一时间段内所述摄像头输出的视频图像帧以及所述事件相机输出的事件数据流,得到所述视觉数据集。4.根据权利要求2所述的方法,其特征在于,按照所述视频图像帧的帧持续时长,对所述事件数据流进行帧重建,形成与所述视频图像帧对应的重建图像帧,包括:将所述视频图像帧的帧持续时长作为单位时间长度,针对每个所述单位时间长度的事件数据流,分别对每个像素点处发生的正事件和负事件进行计数,并基于每个像素点的正事件数量以及负事件数量进行图像灰度值映射,形成与所述视频图像帧对应的重建图像帧。5.根据权利要求4所述的方法,其特征在于,所述重建图像帧包括:第一分量图像和第二分量图像,基于每个像素点的正事件数量以及负事件数量进行图像灰度值映射,包括:将每个像素点的正事件数量映射到第一灰度值区间,得到每个像素点的第一灰度值,形成所述第一分量图像;将每个像素点的负事件数量映射到第二灰度值区间,得到每个像素点的第二灰度值,形成所述第二分量图像,其中,所述第一灰度值区间和所述第二灰度值区间是对0~255的灰度范围进行划分得到。6.根据权利要求1所述的方法,其特征在于,所述第一神经网络对应的目标函数包括:第一子函数和第二子函数,第一子函数用于使得所述第一神经网络输出的预测结果趋近于相应类别标签,第二子函数用于使得所述第一神经网络输出的预测结果趋近于所述第二神
经网络输出的预测结果;所述第二神经网络对应的目标函数包括:第三子函数和第四子函数,第三子函数用于使得所述第二神经网络输出的预测结果趋近于相应类别标签,第四子函数用于使得所述第二神经网络输出的预测结果趋近于所述第一神经网络输出的预测结果。7.根据权利要求6所述的方法,其特征在于,在训练过程中使得所述第一神经网络和所述第二神经网络相互学习,包括:每完成一轮训练迭代后,根据所述第一神经网络输出的类别概率分布以及每个第一图像样本的类别标签,计算第一子函...
【专利技术属性】
技术研发人员:陈雪,刘力行,周莉,
申请(专利权)人:京东方科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。