【技术实现步骤摘要】
样本确定方法、装置、电子设备及介质
[0001]本公开涉及深度学习
,具体而言,涉及一种样本确定方法、装置、电子设备及介质。
技术介绍
[0002]知识蒸馏是一种迁移学习的方法,体量较大的教师神经网络中学习到的特征信息可以被压缩至体量较小的学生神经网络中,以满足在部署于实际应用环境时的体积需求。
[0003]然而在利用教师神经网络训练学生神经网络时,所需要的样本集在特征分布上会表现出长尾特点,样本集中不同类别的样本图像在数量上差距较大,且容易识别的图像远远多于不容易识别的图像,造成基于知识蒸馏技术得到的学生神经网络的性能较差。
技术实现思路
[0004]本公开实施例至少提供一种样本确定方法、装置、电子设备及介质。
[0005]第一方面,本公开实施例提供了一种样本确定方法,包括:
[0006]获取样本集;所述样本集中包括多张样本图像;
[0007]利用教师神经网络,对所述多张样本图像分别进行特征提取,得到所述多张样本图像分别在特征空间中的特征数据;
[0008]基于 ...
【技术保护点】
【技术特征摘要】
1.一种样本确定方法,其特征在于,包括:获取样本集;所述样本集中包括多张样本图像;利用教师神经网络,对所述多张样本图像分别进行特征提取,得到所述多张样本图像分别在特征空间中的特征数据;基于所述多张样本图像分别对应的特征数据,对所述多张样本图像进行所述特征空间上的均匀采样,得到目标样本图像。2.根据权利要求1所述的方法,其特征在于,所述基于所述多张样本图像分别对应的特征数据,对所述多张样本图像进行所述特征空间上的均匀采样,得到目标样本图像,包括:基于所述多张样本图像分别对应的特征数据,在多个采样批次中,对所述多张样本图像进行特征空间上的均匀采样,得到多个所述采样批次分别对应的目标样本图像。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:利用多个所述采样批次分别对应的目标样本图像、以及所述教师神经网络,对学生神经网络进行多个批次的训练,得到目标神经网络。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述基于所述多张样本图像分别对应的特征数据,对所述多张样本图像进行特征空间上的均匀采样,得到目标样本图像,包括:基于所述多张样本图像分别对应的特征数据,确定所述多张样本图像分别在所述特征空间中的概率密度;针对每张样本图像,根据该张样本图像对应的概率密度,确定该张样本图像对应的采样概率;基于所述多张样本图像分别对应的采样概率,从所述样本集中确定目标样本图像。5.根据权利要求4所述的方法,其特征在于,所述基于所述多张样本图像分别对应的特征数据,确定所述多张样本图像分别在所述特征空间中的概率密度,包括:将所述多张样本图像中的每张样本图像分别作为当前样本图像,基于所述当前样本图像对应的特征数据、以及多张样本图像分别对应的特征数据,确定所述多张样本图像分别和所述当前样本图像的距离;基于所述多张样本图像分别和所述当前样本图像的距离,确定所述当前样本图像在所述特征空间中的概率密度。6.根据权利要求5所述的方法,其特征在于,所述基于所述多张样本图像分别和所述当前样本图像的距离,确定所述当前样本图像在所述特征空间中的概率密度,包括:针对多张样本图像中的各张样本图像,利用预先确定的平滑参数该张样本图像和所述当前样本图像之间的距离进行平滑处理,得到平滑距离;利用预先确定的分布函数确定该张样本图像和所述当前样本图像之间距离的分布信息;基于多张样本...
【专利技术属性】
技术研发人员:刘博晓,宋广录,刘宇,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。