【技术实现步骤摘要】
基于无偏深度迁移学习的视频目标识别方法
本专利技术属于目标识别领域,具体涉及一种基于无偏深度迁移学习的视频目标识别方法。
技术介绍
许多机器学习和数据挖掘算法的一个主要假设是,训练和测试的数据必须在相同的特征空间,具有相同的分布。然而,在许多实际应用中,这种假设可能不成立。近年来,迁移学习作为一种新的学习框架应运而生。迁移学习是把一个领域(即源域)的知识,迁移到另外一个领域(即目标域),使得目标域能够取得更好的学习效果。通常,源域数据量充足,而目标域数据量较小,这种场景就很适合做迁移学习。例如我们要对一个任务进行分类,但是此任务中数据不充足(目标域),然而却有大量相关的训练数据(源域),但是此训练数据与所需进行的分类任务中的测试数据特征分布不同(例如视频目标识别中,图片数据集中的数据充足,然而所需进行的分类任务的视频截图却极度缺乏),在这种情况下如果可以采用合适的迁移学习方法则可以大大提高样本不充足任务的分类识别结果。虽然深度迁移学习在实际应用中得到了很大的发展,然而最新的一些研究表明,深度迁移学习模型存在不 ...
【技术保护点】
1.一种基于无偏深度迁移学习的视频目标识别方法,其特征在于,包括以下步骤:/n(1)构建包含有任务标签和偏见标签的源域图像集,从视频中抽取的视频帧图像构成目标域图像集;/n(2)构建偏见属性预测模型,以源域图像和偏见标签组成的样本作为偏见属性预测模型的输入,输出为偏见属性预测值;/n(3)构建基于迁移学习的训练框架,包括与偏见属性预测模型结构相同的两条支路,并在每条支路的相同位置增加一个适应层,其中,第一一支路的输入为以源域图像和任务标签组成的样本,输出为任务属性的预测值,第二支路的输入为视频帧图像,输出为任务属性的预测值;/n(3)构建训练框架的损失函数,该损失函数包括偏 ...
【技术特征摘要】
1.一种基于无偏深度迁移学习的视频目标识别方法,其特征在于,包括以下步骤:
(1)构建包含有任务标签和偏见标签的源域图像集,从视频中抽取的视频帧图像构成目标域图像集;
(2)构建偏见属性预测模型,以源域图像和偏见标签组成的样本作为偏见属性预测模型的输入,输出为偏见属性预测值;
(3)构建基于迁移学习的训练框架,包括与偏见属性预测模型结构相同的两条支路,并在每条支路的相同位置增加一个适应层,其中,第一一支路的输入为以源域图像和任务标签组成的样本,输出为任务属性的预测值,第二支路的输入为视频帧图像,输出为任务属性的预测值;
(3)构建训练框架的损失函数,该损失函数包括偏见属性预测模型的偏见属性分类损失、第一支路的任务属性分类损失以及两条支路的适应层之间的MMD距离损失;
(4)根据源域图像集和目标于图像集,利用损失函数对训练框架进行训练,训练结束后,提取参数确定的第二支路作为无偏视频目标识别模型;
(5)将待识别视频帧输入至无偏视频目标识别模型中,输出目标识别结果。
2.如权利要求1所述的基于无偏深度迁移学习的视频目标识别方法,其特征在于,构建的损失函数Loss为:
为偏见属性分类损失:
其中,c(xi)为偏见属性预测模型对第i个源域图像xi的偏见属性预测值,gi为第i个源域图像xi的偏见标签,为Lc(·)为交叉熵函数;
为任务属性分类损失和MMD距离损失组成的目标任务损失:
其...
【专利技术属性】
技术研发人员:陈晋音,徐思雨,陈治清,徐国宁,缪盛欢,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。