【技术实现步骤摘要】
用于训练神经网络的方法和装置及计算机可读存储介质
[0001]本公开总体上涉及领域自适应,并且更具体地,涉及用于多目标域无监督领域自适应神经网络的训练方法。
技术介绍
[0002]无监督领域自适应是指将使用源域标记数据训练的模型迁移到只含有无标记数据的目标域,并且尽可能保持该模型在目标域的性能。由于源域和目标域存在数据集偏差,并且目标域缺乏标记数据,因此使用源域标记数据训练的模型在目标域的性能往往很差。无监督领域自适应方法能够有效缓解领域差异并且提高模型的鲁棒性。
[0003]目前,大多数无监督领域自适应的方法都着眼于单一源域向单一目标域迁移(single target domain adaptation,STDA)的任务。然而,STDA直接用于同时向多个目标域迁移或者在目标域数据内部异质性较大的场景中,其性能往往不能令人满意。从单一源域向多个目标域迁移的无监督领域自适应称为多目标域无监督领域自适应,简称多目标域领域自适应(multi
‑
target domain adaptation,MTDA)。 ...
【技术保护点】
【技术特征摘要】
1.一种用于训练神经网络的方法,所述神经网络包括分类器和特征提取器,所述方法包括:利用所述特征提取器,对来自源域的有标注数据和来自目标域的无标注数据进行特征提取;利用另一分类器,根据所提取的特征对所述无标注数据进行分类以得到第一类别;针对所述有标注数据构建第一交叉熵损失函数,并且针对被标注为所述第一类别的所述无标注数据构建第二交叉熵损失函数;和通过使所述第一交叉熵损失函数和所述第二交叉熵损失函数的加权和最小,来训练所述神经网络。2.根据权利要求1所述的方法,还包括:利用所述神经网络中的所述分类器,根据所提取的特征对所述无标注数据进行分类以得到第二类别;基于所述有标注数据的所提取的特征与该有标注数据的类别在所述源域的对应类中心之间的距离、以及被标注为所述第二类别的所述无标注数据的所提取的特征与所述第二类别在所述目标域的对应类中心之间的距离,来构建聚类损失函数,其中,所述类中心是基于由所述特征提取器提取的特征来计算的;基于所述源域和所述目标域各自的K个类中每个类的类中心之间的距离,来构建类中心对齐损失函数,其中K是大于0的整数;和通过使所述第一交叉熵损失函数、所述第二交叉熵损失函数、所述聚类损失函数和所述类中心对齐损失函数的加权和最小,来训练所述神经网络。3.根据权利要求2所述的方法,其中,利用所述另一分类器得到所述第一类别还包括根据聚类和类中心对齐后的特征来对所述无标注数据进行分类以得到所述第一类别,其中,通过使所述聚类损失函数最小来实现所提取的特征的聚类,并且通过使所述类中心对齐损失函数最小来实现对所述源域和所述目标域各自的所...
【专利技术属性】
技术研发人员:汪洁,钟朝亮,冯成,张颖,孙俊,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。